6月19日消息,百度主任架构师、推荐引擎负责人廖若雪今日接受媒体采访时透露,百度从去年起抽调技术人员成立独立研发团队,研发“推荐引擎”技术,目前团队百余人。
百度推荐引擎是一项底层技术,目前已经在音乐随身听、百度知道、百度新首页等项目中应用。
什么是推荐引擎?
推荐引擎是主动发现用户当前或潜在需求,主动推送信息、应用和服务给用户的互联网技术。跨领域推荐是在推荐引擎基础上,强调利用通用的推荐技术,进行信息、应用和服务的跨平台推荐。
百度为什么涉足推荐引擎技术?廖若雪介绍,人们在互联网上获取信息的方式大致经历了三代,第一代以分类目录为代表,那时的全网信息量仅数万个网页;第二代即今天使用的搜索引擎,网页数高达数百亿,同时集成了图片、视频、应用等更多媒体内容;下一阶段网页数将超过数百万亿,搜索结果中符合要求的内容可能成百上千,用户需要花费大量时间去寻找最适合自己的搜索结果,解决之道就是推荐引擎。
目前,百度、Google、有道、bing、搜索、Yahoo都是以搜索满足用户的主动表达需求。在国外,以推荐挖掘并满足用户潜在需求的如亚马逊、Pandora、NETFLIX等。
“推荐依赖用户个性化需求。那些用户无法表达,或表达出来非常复杂的需求,我们定义为潜在需求。”廖若雪说。
百度推荐引擎应用于百度知道、百度新首页
廖若雪介绍,百度推荐引擎有三个特点:一是跨领域,多语言、多媒体、全产品形态。亚马逊进行商品推荐,Pandora进行音乐推荐,百度进行跨领域推荐;二是平台化、通用算法、归一化数据;三是智能化,智能需求感知,满足用户需求。
百度推荐引擎于2011年开始研发,早期实践于音乐随身听,自适应用户喜好变化、采用音乐专家系统技术。近期,推荐引擎实践于百度新首页、百度知道。
以百度知道为例,百度方面透露数据,从一个用户在百度知道上提出问题,到这个问题被合适的回答者看到,平均需要12个小时;而推荐技术应用到百度知道后,时间缩短到最多不超过5分钟,回答率提升了50%。
“当用户使用搜索引擎搜索时,浏览网页时,在移动终端上提交他的位置时,都有大量的行为动作。 根据用户的行为提交,再规避掉他们的隐私数据,用一定的算法匹配,就能够智能地感知用户需求,并在短时间内给予他们需要的内容。”廖若雪说。
百度跨领域推荐引擎依托于百度原有的用户数据库。百度搜索引擎储存了上千亿的网页,每天处理100PB级数据。目前,百度推荐引擎是一项基础服务,融入到搜索中,尚未开发独立的产品。“当传统形态不适合时某项服务时,可能打造以推荐为核心的产品。”
廖若雪透露,如果百度推荐引擎发展成熟,不排除以开放平台模式与国内垂直网站合作,如京东商城等电子商务网站。
推荐引擎技术处于早期阶段
廖若雪说,推荐引擎还处于发展早期。“百度走的早些,但大家都处于0起跑线没跑几步的状态。豆瓣电台、电子商务网站做了很多工作,但还没有人做到及格,推荐引擎还是非常新的领域。”
廖若雪描述了未来推荐引擎的一幅画面:如果你是韩剧爱好者,不用再繁琐的查询,就能即使获得最新韩剧推荐;查询“好看的电影”,就能获得符合该用户喜好的电影;搜索“怎么向女友求婚”,就能获得一套针对你和女友量身定制的方案。(可心)