数据采集从原本的一对一,较封闭,到现在的逐渐走向开放。
今天俺想说说免费服务背后的社会化数据采集。
1、小小应用背后海量数据:
1)缩短网址服务商-Bitly.com每天要缩短8000万个链接,相当程度上掌控互联网上的热点和它们的发展趋势,已基于用户的点击数据推出了实时社交搜索、“声誉监测”和“感情分析”;
2)社会化分享应用集成商-AddThis.com已经安装在超过1000万家网站,每月覆盖12亿用户;
国内相应的模仿者JiaThis.com已应用于超过40万家主流网站,集成112家社会化分享服务;
BShare.cn已应用于5万家以上的垂直网站,集成116家社会化分享服务;百度也推出了百度分享应用。
3)t.co短网址链接的日点击量超过1亿;
2、社会化数据采集方式一:缩短网址
Twitter在2011年6月正式推出了t.co缩短网址服务,而在10月10日Twitter在其开发者博客中宣布了,所有在Twitter消息(tweet)和直接留言中提交的超级链接,都必须使用Twitter的网址缩略服务t.co。国内的微博类网站则从一开始就强行使用官方自己的缩短网址服务,新浪微博短网址为t.cn,腾讯微博短网址为url.cn,搜狐微博短网址为t.itc.cn,网易微博短网址为163.fm。除了安全问题,单独且唯一的缩短网址,便于对整个平台用户喜好数据的监控。
早在9月上旬,Twitter Web Analytics发布,旨在帮助信息发布者跟踪、分析Twitter为其网站带来的流量;
2011年9月26日,t.co单月平均排名提升至29位,日均IP近2000万(新浪微博短网址t.cn的全球排名在1800位左右)。
现在社会化网站都会启用一个单独的域名来做缩短网址,从而跨站、跨终端的跟踪用户点击。
缩短网址随时随地记录你的喜好
日夜奔流不息的互联网,传递的不仅仅是信息,大量的商机也随之涌动。亿万网民们在点击、浏览网页时所表现出来的各种喜好、行为都蕴含着巨大商机。
如何收集和分析这些信息一直是互联网领域的重要课题之一(Web Analytics)。网络巨头们绝不会放过丝毫机会,一直在收集着此类信息。但是,常规的Cookie由于种种原因会在传递、分享过程中失去作用。而Twitter推出的t.co短网址服务则可以永远跟踪、收集以t.co域名形式存在的短网址链接,不管何时何地。每天上亿条的信息,无数的网址链接将给Twitter带来海量的信息。经过分析和整理,这些网民们无形中留下的痕迹都会转化为巨大的商业财富。
比如,现在你要监控短信营销的效果,就可以在短信中使用缩短网址,一来减少网址所占用的字数,二来跟踪网址的点击情况。目前已经有商家在这么做了,尽管他们的初衷还只是单纯的缩短网址。
3、社会化数据采集方式二:分享应用
现在各大网站的页面里随处可见这些社会化分享集成应用,这些应用通过提供免费的集成服务,方便了网站,同时也拿到了自己想要的数据:
对于被分享网站
被分享网页点击量
网页分享量统计
子域名分享数据
回流量统计
分时段分享统计
网站自然流量
分享用户属性
对于社会化网站
社交影响力分析
平均回流量统计
分享时段统计
用户分享热点
对于用户
用户喜好数据
分享行为数据
Addthis回顾其五年来统计的全球社会化分享数据,提供了以下结论
人们分享的高峰时间是在上午9点半。
一周中周三人们分享内容最多。
一条链接被分享后一天内会获得全部点击的75%。
大部分用户在内容被分享2分钟后点击。
Twitter是增长最快的内容分享平台,Facebook第二,轻博客Tumblr有上榜。
人们使用最多的分享方式是,直接从地址栏复制网址到电子邮件,IM或其他社交网站,是其他分享工具的10倍。
全球分享最多的国家是美国。
4、国内社会化分享应用服务商
1)、相关文章插件
无觅 wumii.com
2)、社会化分享应用集成商
Addthis addthis.com/analytics
加网 jiathis.com/analytics
Bshare bshare.cn
百度分享 share.baidu.com/analysis
3)、最近火起来的社会化登录集成商
各大主流网站开放账号,使得社会化登录集成有了可能,也有强烈的需求。
友言 uyan.cc
灯鹭 denglu.cc
4)、单独的社会化分享插件、OpenID提供者、通用免费软件商
是个大网站都在推自己的这套东东。哈哈。
让内容走出去、用户的分享走出去,从而想引进来新的用户、留下用户。
5)、基于浏览器的便捷应用
获取你所有的网页浏览数据,及此应用的使用数据。
6)、社会化推荐应用
基于已有用户行为数据库,向第三方网站提供社会化推荐代码,从而为第三方网站提供精准的内容推荐服务,同时获取第三方网站现有用户的行为数据,从而不断扩大用户行为数据为库,使得精准推送质量越来越好。
7)、原来比较早的Rss集成订阅
以FeedSky为代表,只是这个应用对网站方的利益点不多,不像社会化分享,以引流为利益点,让网站们部署上代码,从而拿到数据。
5、我想象,基于更积极主动的数据采集,未来的数据统计分析服务特点:
a.跨站,用户标识唯一性,社会化登录、开放OpenID等让UV更唯一;
b.跨终端,用户行为完整性,如Mixpanel(一个第三方网站分析平台),帮助客户或者顾客实时跟踪用户与其网站、社交游戏、应用程序等的互动,网页-桌面-移动;
c.实时(秒级),分析服务即时性,分析决策快速响应;
d.可视化,报表展现直观、易懂;
e.智能化,精准推荐使得用户交互环境千人千面,So Easy!
f.定制化,垂直化分析,深挖用户喜好;
g.产业化,打通产业上下游数据。