潜望|李彦宏带队的文心一言发布,我们还提前掌握了这些幕后信息
作者丨张小珺
3月16日下午2点,百度在北京总部举办新闻发布会,发布他们的AI生成式产品文心一言。这是继OpenAI发布ChatGPT后,中国第一款生成式语言大模型产品。
这篇文章包括发布会核心内容,以及在发布会前,我们提前了解到的关于这家公司、这款产品的内、外部信息。
01
李彦宏亲自领兵、悄然流行的夜会
这段时间,百度集团董事长兼CEO李彦宏每晚都会和文心一言项目组开会。
这个项目在内部没有特别的代号,没有惊心动魄的目标和口号,甚至既没有在他们褒贬不一的主导文化价值观的全员会“简单之约”上出现过,也没有在距离现在最近一次的总监会上被热烈讨论。所有人对它的称呼只有一个乏味的词——“项目组”。
2023年春节过后,“项目组”就出现了。它由李彦宏亲自过问、CTO王海峰挂帅,两人每晚会和所有相关技术、产品人员,以及CFO、PR和GR、法务高层开会。内部人士说,该团队配置在百度是少见的,这更有利于资源调配。不过,这个神秘组织表现得很低调,极少有信息流露出来。
“除了项目组,没有人见过demo。”一名中层人员说。
“现在能不能做成、能做到多大,都不知道,”另一位接近百度高层的人士称,公司的内部状态是,“背水一战”。
据腾讯新闻独家了解,在百度,文心一言的第一责任人是王海峰,其下属、百度副总裁吴甜也担当重任,她和团队是负责自然语言处理底层技术的主力部队。此外,文心一言的能力向三个场景输出,分别是大搜(指搜索)、云服务和小度音箱。而现在这三个业务的负责人分别是资深副总裁何俊杰(移动生态事业群组总经理)、执行副总裁沈抖(智能云事业群总裁)和副总裁景鲲(小度科技CEO,该业务经拆分是独立公司)。再往下一层,何俊杰团队的VP肖阳、沈抖团队的VP侯震宇也是场景落地的具体执行人。
一种不成文的“夜会”制正在这家公司蔓延。除了每晚李彦宏参与的项目组会议,在这个会议结束后,何俊杰、沈抖于夜间10点左右,还会分别和大搜团队与云团队再开业务会。这个会议有时是每日、有时是隔天,目的也是为了确保文心一言在场景上有落地。
王海峰作为“项目组”执行的头号位,内部人士称,“现在根本见不到人。”
李彦宏在2022年中,对他们的另一款AI作图产品文心一格表现出浓厚兴趣,他在一次总监会末尾,用该产品做了一张图作为会议结束,表达危机总会孕育出希望。
外界对于文心一言的质疑之一是,百度这些年追了太多风口,元宇宙(项目名:希壤)就是一个例子。“像一阵风”,吹过了很快不了了之。所以不看好文心一言的人,很大顾虑来自对百度这个组织的信心。据两名内部人士称,元宇宙项目在其内部只有包括负责人马杰、市场人员在内的少数人有热情;文心一言不一样,是李彦宏亲自领兵的项目。
另外腾讯新闻了解到,李彦宏现在绝大部分时间都投入到了文心一言上。而作为李彦宏夫人、CEO特别助理的马东敏把时间更多放在战略全局、人事上,比如她最近很关注作为百度现金流基本盘的搜索业务。
02
李彦宏在发布会都讲了些什么?
在今天的发布会上,李彦宏作为第一个演讲嘉宾,一上来就讲述很多人问他为什么百度要在现在发布?
他称,百度在过去十几年一直在人工智能投入,文心大模型在2019年已首次发布,后来每年都有迭代。当然现在大家的期望值是对标ChatGPT甚至是GPT-4,期望值非常高,具有挑战性。
随后他说,他在内测过程当中,体验到的文心一言的能力不能叫做完美,但为什么发布?因为有市场需求——包括百度各个产品线,大家都在等着用这样的技术;更重要的是,客户、合作伙伴在等着用这样的技术。同时,大语言模型一旦发布,就会获得真实用户反馈,而有了用户反馈,迭代速度就会很快。
接着,李彦宏开始展示文心一言。他展示了5方面能力,分别是文学创作、商业文案、数理逻辑推算、中文理解和多模态的生成。
比如,在展示第一项能力时,视频中,工程师向文心一言提出了如下问题:“《三体》的作者是哪里人”,“总结一下《三体》的核心内容”,“如果续写的话怎么写”,“如何从哲学角度进行续写”,“电视剧《三体》的演员都有哪些”,“于和伟和张鲁一有哪些共同点”,“于和伟和张鲁一谁更高”……等问题这些问题一一并得到回答。
但展示过程是提前录制好的,没有现场的体验。
李彦宏表示,文心一言现在可以处理英文,但是要承认对英文的处理能力没有中文好。因为训练数据中,英文数据没有那么多,接下来会逐步训练英文和其他语言。
他说,文心一言目前没有向所有受众开放。发布会后现场观众可以拿到邀请码,体验文心一言的自然语言能力、表达能力、逻辑推演能力。这些能力在不断完善中,有时会感受到惊喜,有时会有错误,但它的进步速度快。
在他的演讲后半段,李彦宏分享了他对科技产业演进的认识。他认为IT技术栈到了AI时代有四层:从下到上依次是芯片层、框架层、模型层和应用层。刚发布的文心一言处于模型层,以后AI时代的应用会基于这些预训练大模型进行开发。他说,生成式AI非常耗算力,费用昂贵。四层架构只有相互协同和优化,才能使它的效率比别人高很多。
人工智能带来哪些创业、投资机会?他认为,大模型时代将产生三大产业机会:第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow,调用通用大模型能力,为行业客户提供解决方案。第三类是基于大模型底座进行应用开发的公司,即应用服务提供商,今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,可以涌现出更多创业公司。
但似乎资本市场对这次发布并不买单。百度发布文心一言当日,百度港股股价下挫6.74%至124.6港元,截至现在目前市值是3444亿港元币。
03
跃跃欲试的商业化团队
李彦宏亲自领兵的文心一言能为百度带来转机吗?大多数人持观望状态。
一位接近“项目组”的百度人士说,从在去年12月、今年春节以前,内部关于ChatGPT的讨论就多了起来。ChatGPT的出现证明了,一家公司对于通用AI的持续投入可以获得意外的转折点。在人工智能领域,“涌现”就是这个转折点,它是指在一个复杂的系统中,由许多相互作用的元素之间产生的出乎意料、非线性的结果。但智能是否能突然“涌现”、何时会“涌现”都很难预测,现阶段只能先做投入,但愿能有先发优势。
据了解,百度的文心大模型于2019年上线,从语义训练转向另一种技术路线大语言模型。
语义训练是自然语言处理中的一项关键技术,用于训练计算机程序理解和推断自然语言的意义和语境,实现常见的字幕翻译、语音识别等应用。
大语言模型则是一种基于深度学习的模型,通过对大量语言数据进行训练,生成自然语言的文本,例如执行对话任务。通过使用大语言模型生成自然语言文本,并使用语义训练技术解决文本的语义、语境问题,可以生成更流畅和准确的自然语言——ChatGPT对话的流畅性也是基于类似原理,且强项是生成能力。
值得注意的是,在2023年3月16日文心一言新闻发布会以后,该产品不会向大众开放,而是只会向一部分人做小规模内测。
产品还没推出,公司内部的场景方、变现方看上去已经跃跃欲试。他们想要快速将其转化为可产生收入的商业产品。
据接近该公司商业团队的人士推断,就目前来看,这款产品的商业化空间云服务大于搜索。虽然微软的搜索产品必应已经上线了ChatGPT,但他对该产品的商业变现感到忧虑。他的观点是,搜索的收入来源很大部分是依靠吸引用户注意力的前几条搜索结果,他们暂时在ChatGPT上看不见直接的变现空间。
据公开信息,ChatGPT目前变现路径主要是以API流量费和订阅费为主。而微软旗下的新必应,是在给用户的回答中,会在比较不同商品时给用户提供一个带注释的回答,这些注释如果是广告会进行标记,并可点击跳转,从而实现新必应的广告收入。但究竟变现情况如何,还有待验证。
在百度,由沈抖主导的云团队,短期内寻找了600多家合作伙伴,等待该产品发布后接入,而这可以依靠调用收取一定费用。初期该产品想要帮对方提升对话体验,比如落地在客服这样的细分场景上。
就在百度发布会前一天的凌晨,Open AI发布了多模态预训练大模型GPT-4,在识图能力、文字输入限制、回答准确性以及能生成创意文本、歌词等方面都有突破。这给百度的这场发布会带来了很大压力。
04
中国的Open AI使命会由谁来完成?
现在,人工智能是被认为是起码和互联网爆发是同等量级的大浪潮。一种观点认为,从全球格局来看,数据带有政治色彩,就中美现在的局面看大概率会分割世界AI的半壁江山。做大模型的三个要素是算力、算法和数据。在算力端,手握重金的大公司有显著优势。
目前在中国互联网巨头中,除了百度,字节跳动已确认进军这场角逐,团队由朱文佳来领队。他曾任百度搜索部主任架构师,2015年加入字节,先后负责算法、今日头条App和TikTok技术团队。此外,一系列老牌创业者也已经入局,如美团联合创始人王慧文、出门问问创始人兼CEO李志飞、前搜狗CEO王小川,都在争夺中国版Open AI。
中国版Open AI到底出自谁之手,各方有不同看法。创业公司认为互联网巨头虽然手握重金和资源,但组织效率是短板;而大公司则认为,数十亿、数百亿级投入才是实实在在的入场券,创业公司难以企及,更何况训练大模型还需要海量的高质量数据。
今天,这场军备竞赛才刚刚开始。
RECOMMEND
推荐阅读
ChatGPT的出现,对创业公司来说是机会还是威胁?
创投变辩辩系列02期
不止光刻机,国产芯片还有这些难题要解决
芯事重重17期
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 奋力打开改革发展新天地 7978920
- 2 男子驾车冲撞小学生被判死缓 7939656
- 3 微信可以线上送实体礼物了 7894438
- 4 “冷资源”里的“热经济” 7786317
- 5 刘诗诗方辟谣离婚 7606097
- 6 全球约有1.9亿妇女为内异症患者 7535954
- 7 #胡锡进的2024年终总结# 7410197
- 8 肖战新片射雕英雄传郭靖造型曝光 7390724
- 9 孙颖莎提车 7202049
- 10 蒋欣生图更是妈妈级别 7185731