"ياخشىمۇسىز، مەن تېڭشۈن مىنخەن تەرجىمانى."
ياخشىمۇسىز
(这是维语)
ཁྱོད་བདེ་མོ།
(这是藏语)
它们的汉语意思是
你好
为了便于民族交流,我们做了一款的小程序,名字叫——腾讯民汉翻译。(文章标题的意思就是:你好,我是腾讯民汉翻译。)
(长按扫码体验)
“ۋەئەلەيكۇم ئەسسالام، شىنجاڭغا كەلگەنلىكىڭلارنى قارشى ئالىمىز.”(你好,欢迎来到新疆),产品经理第一次去南疆的时候,一下飞机就被维族老乡这句话蒙住。
在这个有98%维族同胞的地方,语言的障碍成为交流的难题。实现民族语言和汉语无缝交流,是这款产品的初心。
目前它支持维语、藏语(卫藏藏、安多藏、康巴藏)与中文的互翻。
至于,翻译效果怎样?小编找到一位来自新疆的朋友:
#整天就知道吃#系列↓↓↓
他测了10分钟左右,说:
与其他翻译不一样的是,它实现了“实时语音识别+标点断句+翻译+语音合成”的首创。
它还加入了少数民族语言的OCR拍照翻译技术,意思就是它能翻译出照片里的文字。
产品上线以来,未进行任何商业推广,但已经得到各大民汉语言学习社区的认可与应用,作为一级翻译入口。
来自新疆的中国工程院院士 吾守尔斯拉木(维吾尔族) 也用了这款产品,他表示:
腾讯在民族语言的语音、图像、OCR、机器翻译等技术均已达到行业领先,并且有落地的产品打造出来,深入在新疆各地供群众使用。
我试了一下,语音和图像翻译的准确率相当高。
中国有腾讯这样的公司带领一队精英群体把最先进的AI技术带给民族同胞,感谢腾讯做了这项工作。
| 为什么要做这款产品?以下为产品负责人自述:
自己从小生活在西部边疆,虽然是汉族,但耳濡目染下,我渐渐喜欢上各地民族的语言,并选择了中科院自动化所攻读语音识别方向的博士。
一次去南疆做项目,发现那里会汉语的人很少。一位维吾尔族老大爷为了给我指路,说了一口维汉混合的汉语。老大爷说:“我这辈子最大的遗憾就是没有学好汉语,多希望我的孩子们能学好汉语。”。
这对我触动很大,我想用语音识别技术帮助边疆地区同胞们学习汉语。
现在的AI技术帮助人们实现了人机对话以及各种“锦上添花”的憧憬,但我们更希望利用AI技术解决“雪中送炭”的应用。
加入腾讯后,结合团队的能力,这个愿望得以实现。
2016年底,我们开始组建团队,虽然目前团队成员基本都是中科院、清华的博士。但做民族语言识别不同于英汉拥有大量语料资源,项目刚开始,困难就悄然而至。
最大的困难来自前期民族语言语料的获取,最开始录音地点选在大本营北京,但过程并不顺利。
大伙赶紧调整策略,把录音点换到了乌鲁木齐,在各大高校举办宣讲会。老师和同学们积极参加,让团队收获丰富的语料。
但问题又来了,普通的维吾尔语相对好采集,和田方言和罗布泊方言才是最亟待解决的问题,于是我们起身前往南疆,与维吾尔族老乡们深入交流,采集语音。
完全不懂民族语言,是团队的另一大难题。 我们买来了维吾尔语教程,大伙一起从字母、语法、拼音结构开始学,每天早上坚持听微信公众号,同时让团队所有博士每天必须学习微信公众号【维语吧】里的内容,开始啥也听不懂,就从维吾尔语歌曲开始听。一群对语音技术痴迷的博士专家们,从零学起,专注得像个孩子。
产品上线以来,虽未进行任何商业推广,但已经得到各大民汉语言学习社区的认可与应用,并引用我们的小程序,作为一级翻译入口,截至目前累计用户量7w,日活1.3w 。
不仅为语言学习者和旅游者,也在新疆驻村干部和维族用户中得到了良好的口碑,给他们的生活带来了极大便利。
最后,感谢所有为这个工具提供帮助的人。
未来,腾讯民汉翻译将深入教育、商务、办公、旅游等场景,贴近大家,进一步促进民族交流。
*本文转自微信公众号 腾讯(ID:tencent)
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 中秘务实友好的高光时刻 7968232
- 2 最新版中国医院排行榜发布 7938354
- 3 美军核潜艇被渔网缠住了 7869189
- 4 来秘鲁Chifa 这里藏着中国味 7758863
- 5 李行亮坚定选择不离婚 7611769
- 6 PUA刚搞明白 NPD又是啥 7566049
- 7 金鸡奖明星红毯生图来了 7443113
- 8 泽连斯基:明年结束俄乌冲突 7360088
- 9 施工方回应井盖被指一敲就碎 7226903
- 10 这次“太空快递”都带了什么? 7177670