文因互联鲍捷:智能金融决战前夕,我们架起的“步枪”和“刺刀”|AI聚变
栏目简介:自动驾驶、教育、金融、医疗…如你所知,AI 如毛细血管一般正渗透到各行各业,人们为“AI+”可能带来的爆炸性能量而奔走呼号,但也更愿意看到脚踏实地的技术实现和商业落地。为此,《AI聚变》将深入报道各行业公司的 AI 落地情况,以及未来发展的种种可能性。
如果你仔细倾听一个人的谈吐,你会发现某些透露此人想法的关键词在反复出现,尤其当这个人还是企业家的时候,这些词汇背后体现的则是治理公司的一套打法,它们必有出处。
对@西瓜大丸子汤而言——在新浪微博上,他有 5.2 万个粉丝,虽然没有加 v 认证,但也算是小 v 了,平常发一些创业感想、技术思考、生活碎记,还有诗……总之内容像是一锅大杂烩。——“黑猫白猫论”、“农村包围城市”等党在探索中国改革道路时留下的经典理论是他在谈论公司发展时的高频词。
他应该从那些文史里汲取了不少养分。今天早上他读的书是《参谋助手论——为首长服务的艺术》,从书名上你不难猜想大概内容,他发在微博上的评语是“片言苟会心,掩卷忽而笑”。此刻,在他窗户朝南的办公室里,东北方向的两面墙被大书架所占据,其中不乏有《史记》、《韩非子》等书籍。对了,屋里还有一只刚入职三个月的猫,阿丑。
采访就要开始了,但他突然打断向身边同事询问其他两个同事的去向,“在下午两点,(他们)必须——高度一致。”
图/受访者提供
1.
鲍捷是@西瓜大丸子汤的现实姓名,他的实际身份是文因互联的创始人,他们提供智能金融技术与服务。实际上,这家创业公司是他的第二次创业,2013 年初次创业时,他们花了两年时间做了一个叫“好东西传送门”的推荐引擎,但始终无法变现。随后,在综合各种因素排除其他创业选项后,团队将目光转向智能金融。
他们希望做出“金融神经系统”,这与其他企业宣传的“金融大脑”等标签表意趋同,所不同的是其内核,文因互联是以知识图谱为基础来构建整个系统。
鲍捷将其划分为四个阶段。最基础的层次是流程的自动化,比如审计、信贷、监管、证券的自动化。他们已为审计事务所提供了从财务审计到法务审计的服务,如财务数据自动化提取和自动化复合;为证券类客户做了自动财务健康度评测系统、风险评测系统。
其次,自动化之后会带来知识资产化——不止数据,鲍捷认为知识才是金融机构的最核心。现在大量文档中的知识是由人工读取然后储存在大脑,而当机器有了自动化处理能力后,知识会越来越多沉淀在机构系统里。当然,这个过程中除了 NLP 技术外,可能还有区块链等新技术的参与。
再从机构内部扩大到机构之间的数据交换层面,有了金融的知识图谱后,中国所有的金融机构、政府、研究机构间会构造出一个巨大的近乎实时的数据分发网络,鲍捷称其为“金融数据高速公路”。
最终要实现从手工业金融到大工业金融的转变可能需要花相当长的时间,他认为 20 年后的金融业会更像软件行业,“以天为单位的数据交换都要缩短到以秒为计,上市公司债券的风险检查从一个月缩短到 5 分钟”。
回到当下行业现状,手工业金融的进阶并非易事。由于金融机构内部目前无法改变 IT 系统,从源头解决金融数据的结构化寸步难行。事实上还可能是倒退的,鲍捷解释说,一部分数据在源头上已经是结构化数据,但机构间交换数据时却转换成了由人工读写的 PDF 文件甚至是扫描件这样的自然语言,“估计有 200 万人力浪费了”。
他们现在所做的是从接口层面帮助交易所、券商、咨询公司、律所机构等做公告、研报、法规、新闻、甚至扫描件的结构化,这是他们当前的一个“核心”工作。
切入点很明确,他们要从阻力最小的单点逐个击破。
2.
要想攻陷每个阵地,需要的是全链条的数据结构化能力,包括财务报表的公开化提取能力,还有公告、研报、法规的解析,解析后再进行实体链接,映射到知识图谱上,之后是规则建模与推理、语义搜索、自然语言问答。
具体而言,文因互联的技术链条主要围绕结构化数据生成和结构化数据使用两部分:
结构化数据的生成首先需要机器理解文档,比如理解自然语言文档和理解图像,那如何提取 PDF 文件中的数字?这又分为数据清洗、恢复篇章结构到段落、提取元素这三大步骤。提取元素后要做年报、研究报告等渠道的数据集成,将其中提到的大量如人名、机构名等“实体”进行实体识别和实体链接,然后形成知识图谱。随后是结构化数据的使用,他们要把不同客户业务系统中的业务规则与这些数据作关联,这涉及到推理、规则引擎等技术。
对应到产品上,由于 AI 本身的高度复杂性,当它与金融等行业属性结合时,面临的则是数量级的复杂度。
“康威定律”的启发在于,一个复杂系统不应该从一开始就追求大而全,而要从一个简单系统开始,注重系统的演化能力。所以鲍捷认为基于经验观察设计出来的 2B 产品几乎无一例外都会失败,即便这类产品的幕后推手是大企业也会“完蛋”,这类有实力、有生命力的产品都需要从实践案例中总结。
以史为鉴,他拿俄中两国改革方案作类比:俄国改革是“休克疗法”,由诺贝尔奖获得者设计的方案却在现实执行时一塌糊涂,中国改革是“摸着石头过河”就成功了。他认为做人工智能产品理应属于后者。
他们现在还处在做公报和研报解析的初级场景上,鲍捷提及场景跃迁的概念,认为他们的应用场景半径会从 10 亿扩展到 100 亿甚至 1000 亿。“当你从实践中总结出来的那些点逐渐到位时,就会发现技术不断在解锁场景,场景其实一直在那里,只是因为技术没有到那里。”既然如此,做好结构化数据、自然语言理解语义引擎等大量的基础技术工作不可或缺,且无捷径可走,“认不清楚这一点的,就不要在这个行业混了。”
行业竞争已经到了非常激烈的程度,这是鲍捷对行业趋势的感受。他近期写了几篇未公开发布的存稿,其中一篇完稿于 5 个月前,文中写“2019 年会是智能金融的决战年”,但他现在提前了这一时刻,“今年第四季度就是决战季”。
时间的提前是因为他觉察到金融投资的寒冬将至,届时这一阶段的对决会在整个行业准备不足的状态下进行。他没有给出有足够说服力的依据,但笃定于自身对行业竞争在一年之内尘埃落定的判断,“大多数人还没有意识到战争开始的时候,就已经结束了,明年这个时候砸 100 亿都没用。”
那文因互联会如何应战?鲍捷告诉 AI科技大本营,取胜的关键在于团队凝聚力,这考验核心团队的攻城能力,以及公司新人的成长性。而在他看来,文因互联团队在三年长征中获得的最宝贵财产就是塑造了一支坚强的核心队伍,身在其中的每个人的要求都是军官标准。
尽管战役是否会如他所料想的那样如期而至还是未知数,“但刺刀已经架在步枪上了,”与采访前告诫他的军官“保持一致”时的相似口吻,首长鲍捷似乎在指示他们要瞄准,“我们会一寸一寸赢得这个市场。”
——【完】——
在线公开课 知识图谱专场
◆
精彩继续
◆
时间:8月23日 20:00-21:00
添加微信csdnai,备注:公开课,加入课程交流群
参加公开课,向讲师提问,即有机会获得定制T恤或者技术书籍
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 接续奋斗 共谱新篇 7968969
- 2 金价大涨创历史新高 7996131
- 3 敖丙他爸出场 哇声一片 7811479
- 4 申遗后的首个春节这样过 7725316
- 5 大年初三宜好好休息 7642123
- 6 李宇春第一时间取消连续包月 7564928
- 7 2025春节档首部10亿电影诞生 7478737
- 8 李子柒新春同款AI头像来了 7373152
- 9 看完哪吒2喜欢上申公豹了 7238521
- 10 为什么砂糖橘上都有个小洞 7137773