设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 重新 试卷 文件
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)(2)

发布时间:2019-05-14 23:42 所属栏目:21 来源:读芯术
导读:那么描述动词的词副词也会有同样的实验效果吗? I seriously dont know how you fit your head into that helmet. (我真不知道那个头盔怎么塞得进你的脑袋。)奇异博士。 对于一部关于阻止紫薯精毁灭半个宇宙的电影来

那么描述动词的词——副词也会有同样的实验效果吗?

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)

“I seriously don’t know how you fit your head into that helmet.” (我真不知道那个头盔怎么塞得进你的脑袋。)——奇异博士。

对于一部关于阻止紫薯精毁灭半个宇宙的电影来说,台词中有很多类似“right”(没错)、“exactly”(就是这样)、“better”(更好地)这种具有积极意向的副词。

所以,知道了电影中的动作和动作描述,现在是时候看看名词了。

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)

“You will pay for his life with yours.Thanos willhave that stone.” (这将是以命换命,灭霸总会得到那块宝石。)——暗夜比邻星

结果显示,“stones”(宝石)不出意料地出现次数最多,毕竟整部电影都在围绕它们发展。出现次数排第二的是灭霸想要摧毁的“life”(生命),接着是复仇者们没有多少的“time”(时间)(注意:出现次数较多也可能是因为电影中多次提到了“theTime Stone”——时间宝石)。

最后,在进入下一个实验项目之间,探究一下形容词或描述名词的单词。与副词的情况类似,这里也有“good”(好的)和“right”(对的)等表达积极意义的词汇,以及“okay”(没问题)和“sure”(当然)等表示肯定的词汇。

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)

“I'm sorry, little one.” (对不起,小家伙)——灭霸

特定角色使用最多的动词和名词

前面的图片列举了电影中最常见的动词和名词。虽然这些结果让我们对电影的整体感觉和情节有了一定的了解,但它并没有过多地讲述各个角色的个人经历。因此,在特定角色的个人台词中,通过使用前面相同的程序,找到了出现次数前十的动词和名词。

由于电影中有很多角色,所以本实验中只选择了一些台词数量较多的角色。这些角色分别是钢铁侠、奇异博士、卡魔拉、雷神、火箭浣熊、星爵、乌木喉和灭霸。对不起,队长没有入选。

下图展示了这些角色使用次数最多的10个名词。

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)

星爵到底为什么这么频繁地叫德拉克斯?

意料之外的是,大多数情况下,亲爱的英雄们最常提及的名词都是同伴的名字。例如,钢铁侠提及“孩子”(指蜘蛛侠)9次,火箭浣熊叫了奎尔(星爵)3次,而星爵叫了(其实是大吼)德拉克斯7次。

通过进一步的观察,可以推断出每个角色心中最重要的东西。拿钢铁侠的情况举例,统计数据表明“地球”对他来说十分重要。卡魔拉的情况也很相似,她总是念叨着“生命”、“宇宙”和“星球”这些涵义更广阔的实体,并为之付出了自己的生命。奇异博士反复提及他与其余英雄不甚相同的目标——保护时间宝石。还有雷神,由于他和灭霸之间的国仇家恨,他提及灭霸的名字多达8次,当然还少不了新的“干脆面”好友——长得像只“兔子”的火箭浣熊。最后一张图的数据表明灭霸不断念叨着要集齐所有无限宝石,并且多次呼唤他的女儿。

名词极具表达意义,但动词可能无法像名词这样鲜明地表达角色的特征。在下面的图片中你会看到,动词的表达能力相比名词的来说产生的效果甚微。像“know”(了解)、“want”(想要)和“get”(获得)这样缺乏特征性的普遍被使用的单词出现的频数都很高。然而,灭霸的头号粉丝——乌木喉可能拥有整个语料库中最独特的动词。乌木喉就像一个忠仆:除了想方设法获取时间宝石,他主要从事的工作就是用“聆听”、“感到荣幸”等词鼓吹他主子的使命。啧啧,真谄媚。

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)

“Hear me, and rejoice. You have had the privilege of being saved by the Great Titan…”(跪下聆听并感到荣幸吧!你有幸被最伟大的救世主拯救……)——乌木喉

最后来个彩蛋(大雾):格鲁特说得最多的是——

NLP揭秘:除了宝石,女儿也是灭霸的真爱(大雾)

“I am Groot.”(我是格鲁特。)

命名实体

到目前为止,我们已经完成了全篇电影、各位英雄和反派最常用的动词、名词、副词和形容词的探索。然而,为了充分理解一直在研究的所有词,需要加入一些上下文,即命名实体,进行研究。

根据有关spaCy的网页说明,命名实体是“指定名称的实际对象——例如,一个人、一个国家、一个产品或一本书的标题。”所以,了解这些实体就意味着了解角色在说些什么。在spaCy程序源库中,实体都有一个预测的标签,该标签将实体分成人、产品、艺术词汇等等类型(https://spacy.io/api/annotation#named-entities),从而为后续实验提供额外的粒度级别,有助于对实体进行进一步分类。但是,为了简化过程,本次实验中将使用实体本身而不是实体分类。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读