SOSO论坛开放协议规范.doc_第1页
SOSO论坛开放协议规范.doc_第2页
SOSO论坛开放协议规范.doc_第3页
SOSO论坛开放协议规范.doc_第4页
SOSO论坛开放协议规范.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SOSO 论坛开放协议规范合作伙伴公开SOSO论坛开放协议规范SOSO Open BBS Protocol(SOB)版本 V1.0腾讯科技有限公司协议描述什么是SOSO论坛开放协议(SOB)SOSO论坛开放协议(下称SOB),是SOSO合作伙伴直接将论坛格式化数据以XML文件提供给SOSO进行收录,并进行丰富摘要展现的一种数据补充协议。此协议也可以看做是对Sitemap协议的一种扩展,有利于合作伙伴论坛内容更快速地被SOSO收录,并且可以以区别于其他论坛自然检索结果的形式进行更丰富的展现,从而提高被用户点击的机会。Soso目前版本对论坛帖子可以支持如下图的摘要展现方式,并给出了一条自然摘要结果在下方对比:SOB协议文件说明1 SOB协议文件采用.xml格式2 SOB协议文件必须使用GBK编码;3 可以采用gzip(.gz)格式来压缩SOB件4 SOB文件未压缩前目前最大只支持单个文件2MB5 一个SOB文件中包含的Url不能超过50000个,实际支持的Url数目因文件总大小2MB限制可能更少;6 SOB中的Url必须是xml安全的(URLs must be XML Safe (use XMLFormat()7 SOB文件除了提供帖子主题Url,还需要提供该帖子主题下的一些属性字段,属性字段标签参考后面表格的标签定义,注意需包含全部的必须字段才可以被正常收录;其余非必须字段可以不产生该标签或置空或填为默认值,注意强烈建议字段希望能根据站点的情况尽量填写,这些字段将会影响到帖子在检索结果的展现方式或相关性排序;8 SOB文件可以直接提供帖子的正文(可以包含回贴,建议提供前3个回帖),这样可以加速Soso对帖子的收录和展现速度,但注意单个SOB文件2MB的限制适当减少单个文件中的Url个数;正文标签参考后面表格的标签定义,如果不提供正文,Sosospider会根据Url进行下载;9 SOB文件不提供单独回帖的Url和属性作为一个item;10 每个SOB文件列出在最近一段时间发生过更新的帖子数据,比如最近一段时间产生过新的回复,则将该主题Url下的数据放入最近的SOB文件中;如果有其他属性改变,比如产生新的点击(如果数据量较大可以选择对点击数新增比较多的进行更新)、新的精华贴、置顶贴等,这些属性需要Soso的索引进行更新,也可以放入最近的SOB文件中;注意发生更新后的数据不仅需要提供产生更新的字段,而是要提供如新贴一样的所有字段信息,比如主贴正文、主题发布时间等,Soso会对索引中的全部字段进行更新;11 如果在最近时间段内某些主题Url失效,比如帖子被删除、或希望在Soso检索结果进行屏蔽,则也可以将该主题Url数据放入SOB文件,并置标签为非0,具体值参考后面表格的标签定义;失效Url数据可以不包含全部必须属性字段;12 SOB的文件名建议为若干个固定文件反复使用,如sob_0.xml、sob_1.xml、sob_2.xml,建议最少一天进行一次SOB数据更新,如数据需更快被Soso收录则可以加快数据生成的频率,将最近新出现的帖子或有更新的帖子更新到一个或多个SOB文件中去;SOB文件只要保留有最近一段时间的数据即可,对于较老数据(如一周前或一个月前)的数据,sosospider应该基本已经收录,可以从SOB文件中删除,这样也可以保证SOB文件的个数不会太多;13 SOB文件一旦被更新,需同时更新SOB索引文件,数据才可以及时被Soso发现并收录;SOB索引文件是论坛对Sosospider的数据入口,格式定义参考后面的描述;每次SOB文件更新后,需要在SOB索引文件中描述最近发生更新的SOB文件以及对应更新时间,sosospider会反复访问sob-index文件,找到最近有更新的SOB文件进行抓取。【特别提示】为了更好满足用户的期望,建立合作方论坛的口碑,请您推送健康、有效、权限公开(非登录态也可见)的帖子内容。同时,请合作方自觉滤除广告、敏感、违禁内容,及时更新SOB文件,让信息更好、更及时地向用户展现!SOB标签说明标签等级说明根节点SOB文件最顶层的标签,SOB文件中的其它标签都必须包含在该标签内部数据父节点的子节点,下面其他标签的父节点,一个帖子主题下的全部属性标签必须包含在该标签内部必须字段帖子主题的Url地址,注意回帖和翻页地址不用提供必须字段帖子主题标题必须字段帖子主题发布时间,格式为yyyy-mm-dd hh:mm:ss必须字段帖子最后回复时间,格式为yyyy-mm-dd hh:mm:ss必须字段该主题下回复数必须字段浏览数/点击数强烈建议字段帖子主题正文+前3个回帖正文(如果存在回帖),如果支持这个标签,请注意控制单个SOB文件大小不要超过2MB强烈建议字段帖子主题有效性(0正常 1删除 2屏蔽)强烈建议字段主贴作者id/昵称强烈建议字段是否置顶贴(0否 1是)强烈建议字段是否精华贴(0否 1是)强烈建议字段是否推荐贴(0否 1是)强烈建议字段推荐次数强烈建议字段支持次数/顶次数强烈建议字段原创性(0默认值 1原创内容 2转帖)强烈建议字段特殊类型贴子(0普通 1投票贴 2问答贴 3讨论帖 4专题帖 5活动贴)强烈建议字段帖子附加内容类型(0普通 1图片 2音频 3视频 4下载附件)强烈建议字段帖子所在板块名可选字段主题作者身份(0普通用户 1优质用户 2版主 3管理员)可选字段是否交易类帖子(0否 1是)可选字段反对次数/踩次数可选字段转发次数可选字段分享次数可选字段收藏次数预留字段暂未定义,将来可能用于影响搜索结果展现形式预留字段暂未定义,将来可能用于影响搜索结果展现形式预留字段暂未定义,将来可能用于影响搜索结果展现形式预留字段暂未定义,将来可能用于影响搜索结果排序预留字段暂未定义,将来可能用于影响搜索结果排序预留字段暂未定义,将来可能用于影响搜索结果排序SOB举例 /thread-2166541-1-1.html 0 如何让开通了QQ互联的网站显示QQ空间“喜欢”和微博“一键收听”按钮 2011-05-20 16:23:00 2011-06-01 15:16:17 50 4117 想要达到这种效果吗? 1. 网站首页显示“喜欢”和“快速收听”按钮 2.在授权页让更多的用户关注站点的认证空间和官方微博 快来设置你的认证空间QQ号码和微博QQ号码吧 请注意 1. 认证空间QQ号码必须是QQ空间认证的用户(如果你的QQ号还没有被QQ空间认证,那请联系QQ空间 / ,把你加入认证吧) 2. 官方微博QQ号码必须是数字QQ号码,不能是字母或其他非数字,帐号等 否则很可能会出现: “出了点小错,错误原因:An unknown error occurred. Please resubmit the request. 错误代号:1” (EM:131 沙发又是我的了 (EM:166(EM:166 ? houdelei 1 0 0 3 3 1 0 1 Discuz! 云平台 QQ互联 0 0 0 0 1 13 0 0 0 0 0 0 /thread-2176468-1-1.html 0 蜜蜂视听网:漂亮无广告高清电视直播插件升级成 DX2正式版 GBK简体 2011-05-23 20:53:33 2011-06-01 15:44:54 48 2301 DX1.5 正式版下载地址: /thread-1929077-1-1.html 蜜蜂视听网:漂亮无广告高清电视直播插件 DX2正式版 GBK简体 专门为discuz!X1.5正式版推出的又一款漂亮功能的插件,让更多的站友们用上更好的自己喜欢的插件! 本插件为绿色环保插件,不修改任何原文件。 把插件压缩包解压上传到 source/plugin/ 目录下 这个就是DX插件目录 然后进后台安装启用 更新缓存OK了! ( 备注:原DX1.5版使用者可不升级,也可下载程序解压直接复盖原文件 。) 演示网站: 演示图 QQ:103007906 免费下载地址: /msg.php?id=139 (EM:155 数据无法识别 谢谢提出,已修正!可正常使用 qiugenming 0 0 0 1 1 1 0 4 Discuz! 交流与讨论 Discuz!-插件Hack 0 0 0 0 1 36 0 0 0 0 0 0 SOB索引文件(SOB Index)说明一个站点一般有多个SOB文件,对于多个SOB的站点,需要一个名为sob_index.xml的索引文件来指定各个SOB文件的位置。关于SOB Index需要注意:1 SOB Index采用.xml格式2 SOB Index文件必须使用GBK编码3 SOB Index中包含的SOB个数不能超过50000个4 SOB Index压缩前的大小不能超过2MB 标签是否必须说明是SOB Index文件最顶层的标签,SOB Index文件中的其它标签都必须包含在该标签内部是每一条记录的父标签,下面的其它标签都得包含在该标签内部是的一个子节点,用来指定某一个SOB文件位置的Url, 长度不能超过2048否的另一个子节点,描述

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论