为什么我们要有自己的ChatGPT? | 动察
为了不陷入被动局面,并且持续享受AI产业技术升级带来的福利,国内打造自己的ChatGPT很有必要。
文|动点科技
作者|黄尘
编辑|李瑞子
近期,在ChatGPT的热潮席卷之下,已经有数家公司官宣了自己要做ChatGPT或与其相关的消息,其中,一些公司确实长期深耕AI领域,并有一定的技术积淀;也有一些公司借机炒作和玩噱头,希望能短暂提升股价或者转移视线(往往是经营不善)。
从2020年开始,业界认为AI产业已经进入泡沫期,具体的落地愁坏了一众技术不深而烧钱不止的公司。这样的背景下,ChatGPT的兴起让整个AI产业看到了一丝希望。即便此前已经有比较智能的虚拟助手出现,但是ChatGPT展现出来的知识储备广度和灵活应答水平,都令所有的智能助手汗颜,并且已经有了无数值得期待的未来应用场景。
从互联网到科技再到金融,准备加入这场战役的中国企业已经卯足了劲,不仅为了股价,可能还为了能够在未来有故事可讲。
打造本土化ChatGPT的必要性和可行性
即便如此,业界还是普遍认为国内也要有自己ChatGPT。不是炒概念,而是真正践行相关技术,迭代模型。星图比特CEO 张炯认为中国打造自己的ChatGPT,有三个方面的必要性:
“第一是市场端,目前ChatGPT对国内用户不开放,国内用户没法像海外用户一样随心所欲的使用,而从市场层面必然会有一个中国的ChatGPT出现。第二是技术端,目前市场上可见的大模型(LLM)例如ChatGPT的基础模型GPT-3.5基本都是英语为母语训练的,中文基准的自然语言处理(NLP)的效果还是稍逊于英语基准的,所以有个中文基准的模型出现会进一步提升用户效果。第三是数据安全,AI的内容生成本身是基于大量数据训练的结果,并OpenAI已经逐步从一个公益性的项目向市场化转变,未来出于利益等因素可能存在不确定性,还有就是中国大陆要求所有的数据都是本地化保存,这点OpenAI在国内没有团队,数据的本地化保存和维护就很难达到监管要求。”
尤其是第三个方面,理论上讲,ChatGPT不会主动训练新数据,鉴于训练数据的过程,ChatGPT可能会回答带有种族歧视、性别歧视或其他不当言论,如果有人蓄意将ChatGPT这样的产品用在干扰舆论、挑动社会情绪上,存在潜在的社会风险。
假如我们没有自己的ChatGPT,就无法控制用来训练模型的数据的所有者和种类,无法在后续通过算法和训练数据进行纠正,大量虚假数据的存在,也给知识产权和社会问题的追责带来了极高的难度。
未来如果AI技术大规模普及,我们跟国外AI大模型的代差拉大到不得不用的时候,那么在ChatGPT上也将面临类似芯片的卡脖子局面。为了不陷入被动局面,并且持续享受AI产业技术升级带来的福利,国内自己打造ChatGPT很有必要。
对于中国自研类ChatGPT产品的发力难点,张炯告诉动点科技:“目前中国大规模应用的聊天机器人与NLP的子任务相关,如机器翻译、智能客服、问答系统等。随着LLM的发展,中国也将普及基于LLM的AI聊天机器人。”
他认为中国自研的聊天机器人在应用上至少需要满足以下要求:首先在交互层面机器人需要适配中文习惯的表达方式,也就是说要理解人类表达的命令。另外,在沟通阶段,为了达到无障碍沟通,机器人需要熟悉中国历史文化等相关的知识,并且使用中国语言风格和表达习惯进行交流,比如同一个词语在不同语境下表达不同的意思和情感。再者,聊天机器人需要根据中国的用户需求和社会现状提供个性化的服务,比如中国特有的支付方式、民族习俗等。
由于国内对AI技术尤其是大模型和相关芯片算力的投资规模以及底层技术还远不如美国,因此想要在短期内达到OpenAI的水平并不容易。
不过长远上看,国内有优秀的算法工程师、统一的大市场、丰富的应用场景和数据源,而且张炯也直言做好中国的ChatGPT并不是没有机会。“大数据方面中国走的很远,国内的各类场景信息化程度都很高,数据源丰富,并且相关的产业链也完整。但模型方面就略显不足,目前像ChatGPT的基础GPT-3.5这样的都是大模型,大模型前期投资大、见效慢,在以前对国内的投资者来说就不是优选的标的,所以只有少数大型互联网公司会参与,但投资也是有限的,进展缓慢。不过这也是机会,我相信ChatGPT这一波对国内的产业投资者也好,互联网公司也好都是警示,之后应该会迎来更大的投入。”
本文为动点科技记者原创文章,未经授权不得转载,如需转载或开白请在后台回复“转载”。
互动话题
*想要获取行业资讯、和志同道合的科技爱好者们分享心得,那就赶快扫码添加“动点君”加入群聊吧!群里更有不定期福利发放!
推荐阅读
精彩好文值得推荐!
一键转发,戳个在看!
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 古城老街蕴文脉 7975188
- 2 小孩引爆沼气家长付天价赔偿系谣言 7921615
- 3 正月初五为啥又叫破五 7877486
- 4 来看N种过年新玩法 7755600
- 5 年轻人又开始“整顿”春节了 7689676
- 6 谢娜晒7岁的跳跳俏俏 7501008
- 7 美宣布对中国商品加征10%关税 7479619
- 8 媒体人称马布里已报警 7301540
- 9 王鹤棣谈恋爱更喜欢姐姐 7253496
- 10 行在路上奔团圆 非遗民俗贺新春 7147001