有没有精神病,和这个模型聊聊就能确认
作者 | 神经小姐姐
来源 | HyperAI超神经(ID:HyperAI)
【导读】精神疾病和语言之间,存在着一些微妙的关系,但即便是经验丰富的医生,也不足以完全掌握这一联系。但从数据的角度出发,机器学习算法有望被利用在语言分析中,从那些异常的语言特征中,找到会演变成精神疾病的个体,从而帮助精神健康的建设和预防。
精神健康逐渐在威胁着更多人的生活。甚至有专业人士断言,二十一世纪最大的威胁就是精神疾病。
精神疾病,也称精神障碍、心理疾病。主要是指大脑功能出现失调,导致认知、情感、意志和行为等活动出现问题。常见的的精神疾病包括:精神分裂、抑郁症、自闭症、痴呆症、人格障碍等。
精神疾病患者往往承受着污名化等问题
精神疾病之间和犯罪行为之间也总是道不清说不明
精神疾病严重影响个人的生活,还会成为社会的不安定因素。
精神疾病的传统诊断:依赖专家
精神疾病的诊断也很重要,若能及时地诊断出来,能帮助患者更好的应对和治疗,而对那些想假借「精神判定」而开脱的人,用证据则能让他们接受正义的制裁。
在章莹颖被害案件中,
狡猾的凶手就妄图用精神疾病来为自己开脱
但常规的诊断方式比较繁琐,在经过详尽的精神检查、躯体及神经系统检查、脑影像学检查和神经心理学评估后,医生给出一个初步判断,还要再结合完整的病史资料,特别是个人生活史、发病史、相关社会心理因素,进行分析归纳,给出最后的判定结果。
传统的方式也存在弊端,比如缺乏直接可见的生物学客观指标,还依赖于症状学的临床观察,以及专业医生的个人经验。
针对不同群体,不同功能,不同流派中,心理量表有着不同的诊断标准和规范
而一些研究表明,语言的细微特征,能够用来预测一个人是否会患有精神病病的风险。但这些特征通常不能被人为观察到,需要借助一些技术手段,而机器学习就成了最好的选择。
「即便是有经验的医生,在交谈中试图听出这些细微差别,也十分困难,就像在用眼睛去看微小的细菌,几乎不太可能。」
哈佛医学院神经学系的研究者 Neguine Rezai 说到,「但机器学习等计算方法,用来揭示隐藏在语言中的细微之处是可行的」。她补充说:「这些方法就像是加上了显微镜,可以准确地发现那些征兆。」
在 Nuture 子刊,专门报道精神疾病的 NPJ Schizophrenia 杂志上,埃默里大学和哈佛大学的研究人员发表了一篇论文《A machine learning approach to predicting psychosis using semantic density and latent content analysis》,他们利用机器学习技术,揪出了语言方式和精神疾病的隐秘联系, 能够准确地预测出精神疾病的早期现象。
文章链接地址:
https://www.nature.com/articles/s41537-019-0077-9
新的诊断方式:从文本分析找出语言的秘密
为了从语言中发掘出判断的依据,他们使用了两个语言变量:语义密度和声音相关词汇的使用。
语义密度是用来对「内容匮乏」或模糊性进行度量的一项指标。使用 vector unpacking 的数学方法,获得语义密度的语言标记:将句子的含义分解为其核心思想。
vector unpacking 的过程:单词嵌入(黑色向量)在句子中求和,以产生该句子的结果向量(蓝色向量) ,最终分解找到意义向量(红色向量)
为了让模型建立起判断的基准,从 Reddit 网站上的 3 万个帖子,抓取对话内容,使用 Word2Vec 程序,分析出对话中的词汇。对单词进行处理分析,使那些具有相似含义的单词在「语义空间」中靠近,含义差异较大的则距离很远。
使用 Word2vec 通过两层神经网络处理大量文本来创建单词嵌入
接下来,将埃默里大学北美前驱症状纵向研究(NAPLS)中 40 名患者的言语样本输入,并进行了为期两年的随访。为了训练模型,还采集了第二阶段研究的另外 30 名参与者的信息。
最后,研究小组将来自 NAPLS 的会话信息,通过机器学习分析,与基线数据进行了比较。再综合与后续数据的比较,包括那些最终患上了精神疾病的数据。就得到了语言和患病几率之间的联系。
基于语义密度和声音的转变为精神病的可能性
结果显示,分析的人群中,最终患上精神病的人员,有一些共同的特征,在他们的谈话内容中,与声音相关的(如语气词)的使用率高于正常标准,而且会很频繁地使用含义相似的词汇。
在他们的方法中,通过语言内容预先推测精神疾病,在实验中的准确率达到了 93%。
研究者之一 Elaine Walker 教授说到,如果能更早地识别出有风险的个体,并采取预防性干预措施,就能够极大地改观精神问题。
不止于精神疾病,前方是大脑的奥秘
虽然实验得到了很高的精确度,但由于样本数有限,实验还处于研究层面上的成功。而研究者也表示,他们正在朝着完善和产品化的目的前进,未来计划用更多的数据,来测试和改进这一技术。
无论如何,新技术的应用,再次印证了可以从数据中,听出自然语言的「弦外之音」。
在最近的 Nuture 杂志上,封面文章刊登了一项惊人的成就。哥伦比亚大学的研究人员用八年的时间,完整描绘了秀丽隐杆线虫的所有神经网络及连接。
线虫的完整神经图谱
这种线虫的有三分之一的细胞都是脑细胞,所以绘制出线虫脑细胞的神经连接,是人类第一次解密关于脑部的详细运作方式。
对精神疾病的研究,也有助于对脑部的探索,虽然说 AI 发展模仿神经连接的方式的道路,现在式微了,但探索大脑的奥秘,是人工智能诞生之处就存在的一个梦想。
有关精神疾病的这些探索,只是小小的发现,但它在揭示精神疾病的信息之外,还有助于理解大脑是如何工作的,比如演绎大脑是如何将各种想法组合在一起。不可否认,这些发现堆积在一起,终将带来新的篇章。
更厉害的算法、技术的使用,让诊断和治疗都带来了新的突破,但技术还没有神话到可以接管一切的地步。只是期望着,更多方法的介入,能够让越来越多的人,拥有更健康的生活。
(*本文为 AI科技大本营转载文章,转载请联系原作者)
◆
精彩推荐
◆
推荐阅读
正态分布为何如此重要?
智能文本信息抽取算法的进阶
入门必备 | 一文读懂神经架构搜索
印度人才出口:一半美国科技企业CEO是印度裔 | 数据分析中印青年
为什么说“大公司的技术顽疾根本挽救不了”
25 年 IT 老兵零基础写小说,作品堪比《三体》| 人物志
中小企业搭建混合云,服务器如何选?
从0到1 | 文本挖掘的传统与深度学习算法
一览微软在机器阅读理解、推荐系统、人机对话等最新研究进展 | ACL 2019
1.2w星!火爆GitHub的Python学习100天刷爆朋友圈!
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 准确把握守正创新的辩证关系 7965028
- 2 中国黄金原董事长家搜出大量黄金 7939515
- 3 空调英文不会男生盯着考场空调看 7814179
- 4 消费品以旧换新“加速度” 7765474
- 5 被铁路售票员的手速惊到了 7631187
- 6 网红赤木刚宪爆改赵露思 7591966
- 7 县委原书记大搞“刷白墙”被通报 7415075
- 8 山姆代购在厕所分装蛋糕 7394973
- 9 马龙刘诗雯穿正装打混双 7284990
- 10 刘强东提前发年终奖 7199841