介绍:
搜索引擎查询日志库设计为包括约1个月(6月)Sogou搜索引擎部分网页查询需求及用户点击情况的网页查询日志数据集合。为进行中文搜索引擎用户行为分析的研究者提供基准研究语料
格式说明:
数据格式为
访问时间\t用户ID\t[查询词]\t该URL在返回结果中的排名\t用户点击的顺序号\t用户点击的URL
其中,用户ID是根据用户使用浏览器访问搜索引擎时的Cookie信息自动赋值,即同一次使用浏览器输入的不同查询对应同一个用户ID
相关任务:
相关性排序
用户兴趣挖掘
查询扩展
新词发现
相关资源:
成果列表:
1.Predicting Epidemic Tendency through Search Behavior Analysis.
Danqing Xu, Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma. In Proceedings of the 22nd International Joint Conference on Artificial Intelligence (IJCAI-11) (Barcelona, Spain).
2.How do users describe their information need: Query recommendation based on snippet click model
Yiqun Liu, Junwei Miao, Min Zhang, Shaoping Ma, Liyun Ru. Expert Systems With Applications. 38(11): 13847-13856, .
3.Automatic Search Engine Performance Evaluation with Click-through Data Analysis.
Yiqun Liu, Yupeng Fu, Min Zhang, Shaoping Ma, Liyun Ru, Poster proceedings of the 16th International World Wide Web Conference (WWW07), , Banff, Alberta, Canada.
4.基于用户行为分析的搜索引擎自动性能评价
刘奕群,岑荣伟,张敏,马少平。软件学报,
5.Automatic Query Type Identification Based on Click Through Information
Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma, Asia Information Retrieval Symposium(AIRS06), in LNCS Vol. 4182: pp. 593-600, .
6.基于大规模日志分析的网络搜索引擎用户行为研究.
余慧佳,刘奕群,张敏,茹立云,马少平, 第三届学生计算语言学研讨会(SWCL).
下载:
下载前请仔细阅读“搜狗实验室数据使用许可协议”,请在使用了本语料库的论文、技术报告等研究成果中添加如下参考文献引用:Yiqun Liu, Junwei Miao, Min Zhang, Shaoping Ma, Liyun Ru. How Do Users Describe Their Information Need: Query Recommendation based on Snippet Click Model. Expert Systems With Applications. 38(11): 13847-13856, .
Please read the "License for Use of Sogou Lab Data" carefully before downloading.
迷你版(样例数据, 376KB):tar.gz格式,zip格式
精简版(一天数据,63MB):tar.gz格式,zip格式
反馈:
在线上反馈留下您的宝贵意见和建议。
在资源下载FAQ中查找您遇到的资源下载问题的答案
如果觉得《搜狗搜索php 搜狗实验室》对你有帮助,请点赞、收藏,并留下你的观点哦!