成为0.01%!利用TensorFlow.js和深度学习,轻松阅读古草体文字
“古草体”与现代日文
数据化处理远远不够,能阅读才是根本
塔琳女士手拿“古草体”文本。本次项目由信息与系统研究机构和数据科学研究(ROIS-DS)、人文开放数据联合使用中心合作完成。
声明:本项AI的开发使用了谷歌技术,可能会让大家误以为是谷歌开发的,实际不然,在此指出并订正。另外,准确地说,项目的操作内容不是“翻译”而是“翻刻”。特此声明。
将明治时代的“古草体”转换为现代日语
东京神保町的二手书店里有数千本古籍在售卖
AI不能解读的地方被做了标记
声明:虽然该项目是“谷歌协作开发”,但是谷歌只是本次活动的主办方,没有协助此次项目开发。特此声明。
利用深度学习和TensorFlow.js,开发名为“KuroNet”的工具
名为KuroNet的“古草体”OCR,以及将它应用于TensorFlow.js进行特征识别
声明:开始时用的是“国立信息学研究所拥有的数据”,但正确的应该是“国家文献研究博物馆所拥有的数据”。特此声明。
KuroNet2秒就“翻译”完一页
“翻译”一本古文需要一个小时,正确率为85%
TensorFlow.js提供的Web程序
开放源码提供
在Kaggle上举办比赛募集提高OCR识别率的方法
https://www.nii.ac.jp/news/release/2019/0710.html
Kaggle上举行的比赛
实习/全职编辑记者招聘ing
加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 澳门是伟大祖国的一方宝地 7942382
- 2 女子穿板鞋爬山回家脱鞋时被吓一跳 7991937
- 3 张雨绮 为了讨大家喜欢才穿成这样 7885168
- 4 2024 向上的中国 7730438
- 5 大S老公具俊晔站C位跳女团舞 7679916
- 6 停个车数据就泄露了 7558734
- 7 特朗普赞成TikTok继续在美国运营 7493684
- 8 汪峰红毯现场回应汪峰定律 7335046
- 9 男子暴瘦110斤后被质疑戴人皮面具 7224735
- 10 央视曝光未成年人绕开防沉迷只需4元 7100731