百度的 All in AI 为什么在搜索乱象问题上行不通?| 畅言

百家 作者:CSDN 2018-09-19 04:01:44

“百度更懂你?”屡禁不止的搜索乱象背后究竟是百度为首的国内厂商们技术太差,还是这届网友不行?

作者 | 小谦

责编 | 郭芮

在用户、媒体、有关部门的多重监督之下,国内的搜索体验对比多年前已经有所改善,但依然还是有一些搜索乱象出现在人们的生活中。

近日,据央视报道,9月8日晚,上海市工商局表示,复大医院利用百度推广,将本地知名医院的关键词作为搜索关键词,以提升自己医院的搜索排名。其行为涉嫌虚假宣传,上海市工商局检查总队已立案调查,并将依据《中华人民共和国反不正当竞争法》对其处罚。

消息一出,各大主流媒体纷纷对这一乱象进行跟踪报道,百度竞价排名似乎大有死灰复燃现象。对此,百度作出紧急回应:“尽管百度一直致力于打击仿冒网站、黑色产业等,但总有一些不法分子想方设法,试图侵害网民的权益。当网民使用百度搜索时,如遭遇搜索推广结果中因假冒、钓鱼欺诈等网站受到损失,只要提供相关证据,百度将不设上限进行“全额”先行保障!”——虽然百度本次在乱象曝光后的态度足够诚恳,但还是没能消除从业者和用户对百度搜索推介的一些质疑。

那么,百度对搜索乱象提出的一些解决方案是否有效?如果无法彻底根除搜索乱象,那百度至少会需要作出一些怎样的改进?今天,我们就一起来结合整个搜索行业,来谈谈百度目前提出的搜索推荐究竟靠不靠谱。


所有搜索引擎都有医疗广告,搜索医疗广告不应该被妖魔化


首先,与搜索引擎相关的医疗广告已经导致了多起事故发生,作为一个对接用户与商家双方需求的平台,真实有效的医疗信息和医疗广告,确实是可以帮助用户解决一些生活中遇到的问题。

举个例子,在没有搜索引擎没有互联网网站之前,由于信息不对称的因素,一些庸医误人的现象也是频繁发生。毕竟用户本身并没有办法基于过往的例子和材料判断一个医院/医生是否足够专业,只能通过口口相传和医院品牌来对一位医生进行判断。同时,如果去一个知名的大医院,要么就需要熟人带领才可以熟悉了解看病流程,要么连挂号都需要提前去医院才可以进行。

搜索引擎和互联网的出现,至少在挂号、就诊流程、医院和医生资料案例公开等方面都提供了一些帮助,可以让用户更方便地找到一些医院的信息,并且更好地看病。所以,本身搜索引擎出现医疗相关信息我认为是一件好事,但对于一些知名医院和医生以竞价广告进行流量劫持的行为,这确实给广大用户带来了巨大伤害。

做好了真实医疗信息的对接,搜索引擎可以说是大功一件,但如果给虚假信息提供了更加优质的排名,这很可能就会误人一辈子。值得一提的是,目前的市场,包括百度、谷歌、360、搜狗、必应在内的所有搜索引擎都有医疗广告。据新华社一篇名为“医疗竞价广告卷土重来:公然把公立名牌医院搜索名称卖了”的报道显示:新华社记者在百度、搜狗、必应、360等多款主流搜索页面搜索相关关键词后发现,医疗竞价广告悄然重现,搜病名先推荐医院,甚至还出现了公然售卖公立名牌医院搜索名称的现象。在一些搜索网站上,公然将正规名牌医院名称售卖给他人的情况常见,有的虽然在PC端下架了医疗广告,但移动端App中却将广告置顶了。

因此,所有搜索引擎都有医疗广告。医疗搜索结果和医疗广告用到实处,确实还是能对用户起到很大的帮助。所以,搜索医疗广告不应该被妖魔化,不应该被一棍子打死。

当下,可以说医疗广告已经成为百度乃至整个搜索行业都必须解决的一个难题。都说拥有多大能力就得承担多大社会责任,百度作为国内最大的搜索引擎,多次因搜索问题导致事故发生并引起巨大风波,确实需要比其他同行更大力度去整治这些医疗广告内容。


全额保障只是基础,所谓的防护技术是否真有用很关键


如果说医疗广告可以合理合规地成为搜索引擎提供的标准内容,那至少也得解决当下的搜索乱象问题,各大搜索引擎才能真正为用户提供好医疗服务。百度既是此次重点被曝光的对象,同时也是中国搜索引擎里最应该去解决医疗广告问题的平台。

在此次上海复大医院事件中,百度虽然快速推出了保障的计划。但在我看来,保障还只是一个基础。用户通过搜索引擎来找医院,自然不是抱着要百度赔偿的目的,而是真正想解决医疗方面的问题,而能否真正保证信息的准确性,就需要考验到百度和众搜索引擎的决心和技术力量了。

在后续的声明中,百度重点提到了其利用人工智能技术打击一些搜索乱象的例子。事实上,百度很多的技术也逐渐公开,那么百度目前所提出的这些技术解决方案究竟有没有办法根治搜索广告乱象?技术会是解决搜索乱象的大克星吗?下面,我们就从百度自己所说的技术来进行一些分析。

在声明中,百度表示用人工智能技术对一些变体词进行有效打击,经过百度 AI 审核拒绝医疗变体词推广量日均达160万,2018年上半年拒绝医疗变体词推广量超3亿。

变体词是什么呢?如上图所示,用一些错别字或者繁体字来进行伪装的关键词,这个要识别的话,理论上就将一个丰富的词库进行比对就也可以实现。针对这一变体词,如果可以直接屏蔽关键词,这确实可以起到一定整治的帮助。但就以百度官方宣布的例子来看,笔者在搜索“痔疮”、“zhichuang”这类关键词,均还是发现了一些竞价广告。

目前还无法确定这是否是一个偶然,但如果百度能够识别到一些相关变体词而不对这样的关键词结果进行锁定排序,不准竞价广告渗入,那这样的技术很难在其整治搜索乱象中发挥价值。同时,百度还有建立一个黑名单的词库。有消息显示:截至目前,百度的黑名单词汇总量超过50万个,涉及医疗类的词汇总数达25万个。同时,2018年1月至今已拒绝不良的医疗广告为2.2亿条。

这样的黑名单词库,如果可以对这些关键词结果进行屏蔽,那自然是一个好技术,但如果不行也还是无法发挥价值。此前,一直也有百度风控技术在外流传,涉及非法敏感(赌博欺诈、色情低俗、涉赌贩毒等)、违反广告法(商标侵权、虚假广告等)、内容不合规(歧义误导等)和用户体验差(感官不合、反感描述等)这4个方面,都会被这个AI风控技术所监控。

有消息透露,AI 加权后百度的侵权风险露出率从2015年的0.97%下降到现在的0.25%,降低率达到74%;侵权识别准确率也从2015年的68.3%提升到现在的98.6%,准确率提升近45%。虽然这些AI技术也会对改善一些搜索问题有帮助,但要让整个搜索引擎的乱象都更少,这其实需要人工与技术的一起协同,才有可能把这样的问题给解决好。


两大方向,改善搜索问题关键还是要靠决心和及时响应的服务


可以说,技术确实可以帮助搜索引擎更好地整治一批搜索乱象。但纯靠技术,至少目前来看是很难将搜索乱象根治。我认为要改善这些问题,两个方向值得去尝试。

要有整治决心,广告数量和质量都要被控制

广告是搜索引擎最核心的盈利方向,包括百度、谷歌、360在内的一众搜索引擎。但就以百度、360来说,其竞价广告大多数都是各地代理商去联系客户,去提供广告内容。

我们虽然相信百度会用技术办法去打击搜索结果,但这个优化的过程可以说永远没有终点。举个例子,几乎每个搜索引擎都有关键词联想词,除开一些变体词以外,很多也还会利用一些关键词联想词进行广告投放。既然百度有技术实力可以检测判断到这些关键词联想词,那同时屏蔽掉这些关键词联想词的搜索结果相比也是可以实现的吧?

同时,高额利益的优化下,很多代理商也就只能铤而走险地去帮助一些客户上架一些违规广告。就目前来说,用竞价广告投放一些“高收益”的服务或商品,已经成为了一个巨大的产业链。

纵然没那么大的能力很快时间就把这个产业链打击掉,但百度可以通过控制特殊领域的广告数量来保持特殊领域关键词的搜索体验。就以医疗广告来说,所有百度入库的正规医院直接用品牌官网给予优质位置后,一律不允许竞价广告对这些相关关键词进行投放,这才能保障百度自然搜索结果与竞价广告处于同一个标准,让用户搜索一些医疗关键词的时候尽可能地找到正规准确的信息。

所以,在技术已经解决一部分事情的情况下,要做好搜索乱象整治的事情,需要所有搜索引擎拥有巨大的决心。

用户反馈要及时,用户全民来监督

在这次复大事件声明中百度提出:尽管百度一直致力于打击仿冒网站、黑色产业等,但总有一些不法分子想方设法,试图侵害网民的权益。

在巨额利益的吸引下,大批不法分子不断与百度乃至所有搜索引擎的规则进行斗争,如果纯靠搜索引擎平台来保障网民的权益确实不是一件易事。

但从某种意义上来说,百度可以投入更多人力专项审核包括医疗在内的广告投诉,及时响应用户投诉,同时对提供违规广告主体以及开通广告主体销售人员进行严厉惩罚,这本身就可以有效提升特殊行业关键词的搜索质量。

目前来说,虽然百度也已经开放了举报入口,但一个是反馈速度不够及时,另一个就是违规广告数量实在太多。与其等到用户上当受骗后给予全额补偿,或许用有奖举报的方式引领全民监督的方式更人性化。这结合一些AI技术与针对广告销售体系的严惩内容后,相信会比当下的整治结果更有利。

好的搜索结果,会提升用户的生活品质和工作效率,但一个违规的搜索内容却很有可能误人一生。技术是死的,一直都会有漏洞,要真正解决搜索乱象问题,或许还得是人与技术相结合,才有可能给整个搜索行业带来优质的体验,这或许是百度、360、神马、谷歌都需要深思的问题。

声明:本文为 CSDN 「畅言」栏目投稿文章。作者独立观点,不代表 CSDN 立场。

「畅言」是 CSDN 公众号专门开设的评论类栏目,针对当前业界发生的大事以及行业痛点,面向所有互联网从业人士,专注于「百家争鸣,各抒己见」。我们相信观点愈辩愈明,摆此擂台,等你来战!只要你的逻辑表达清楚、专业,数据引用准确、可靠,角度独特、话题前沿深入,欢迎投稿,一起畅所欲言!


征稿啦

CSDN 公众号秉持着「与千万技术人共成长」理念,不仅以「极客头条」、「畅言」栏目在第一时间以技术人的独特视角描述技术人关心的行业焦点事件,更有「技术头条」专栏,深度解读行业内的热门技术与场景应用,让所有的开发者紧跟技术潮流,保持警醒的技术嗅觉,对行业趋势、技术有更为全面的认知。

如果你有优质的文章,或是行业热点事件、技术趋势的真知灼见,或是深度的应用实践、场景方案等的新见解,欢迎联系 CSDN 投稿,联系方式:微信(guorui_1118,请备注投稿+姓名+公司职位),邮箱(guorui@csdn.net)。


————— 推荐阅读 —————


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接