您要打印的文件是:互联网分类信息的关键问题

互联网分类信息的关键问题

作者:     转贴自:百度    点击数:1893


    “明月别枝惊鹊,清风半夜鸣蝉。分类信息众人评,听取嘘声一片”——“糖”诗一首。

    之前写了《冒充一次郭德纲:分类信息初长成》一文,提到的是笔者看好一种盈利模式,原想续写个人用户如何付费,却发现有人表态“分类信息关键问题是信息的有效性”,用户需要的是真实有效的信息,这大家都明白,可是用这样的评论去回复关于如何收费的文章,是明显的文不对题!于是特草此文,以表吾见。

    先说“信息的有效性”——这是什么概念?
    个人认为,说到底,信息的有效性的问题就是一个诚信的问题,而诚信问题不仅仅是分类信息这个领域,或者互联网这个行业需要面对的问题,而是整个社会面对的问题。通过简单搜索(插播广告一条:如果崇尚行为艺术,请使用百度搜索。百度搜索永远是你浪费时间的首选工具。)可以发现,在互联网业内,需要面对“信息有效性”这一问题的领域还有电子商务、网上交友、广告联盟等等,而放眼整个社会:金融、保险、房地产、教育……哪里不需要面对诚信问题?全世界铺天盖地的广告是不是都需要面对诚信问题?我国的国务委员和人大代表、委员们都把诚信问题和全社会联系在一起,而某些业内人士还在强调这种“关键问题”,多少让人觉得莫名其妙。按照这种逻辑,甚至大可偏激的说:“任何行业关键问题都是诚信问题!”,之后将此话用在所有文章的评论中去。毕竟“人无诚不立 商无信不兴”这是世人共识的。

    “去粗取精、去伪存真”——个人认为这种哲学思想同样也是网络分类信息平台运作的指导思想。现实来说,如何为用户提供真实有效的信息?作为互联网分类信息来说,除了沿用传统行业对信用的度量和监控标准及体系之外,最重要的就是挖掘互联网的自身特点和优势,来尽可能的阻止和屏蔽无效信息的发布。

    何为无效信息?目前无效信息大致可以为分如下几种:A.垃圾信息、B.重复信息、C.过期信息、D.虚假信息。针对其特点目前可以通过以下方法处理:
    1.原则上,可以采用传统平台/组织对信息发布者的证件、身份、电话等的验证方式审核数据,对于商业用户可以到工商行政等部门查询和核实。适用范围:A、B、C、D
    2.建立关键字信息库,对敏感关键字、非法关键字等进行提取并成库,用以对信息内容的过滤。适用范围:A、D
    3.通过TRS公司的CKM软件(中文自然语言处理包)进行信息匹配度分析,加以过滤。适用范围:A、B、D
    4.通过调查和统计、结合平台实际情况(信息数量、用户、点击等指标)对热点和非热点信息进行估量,设置不同的有效时限,及时处理信息。适用范围:A、C
    5.根据用户的反馈和举报,对争议性信息及信息发布者帐号、IP等进行屏蔽处理或人工审核。适用范围:A、B、C、D
当然,具体的处理方式是很多需要经过认真分析和研究的,如关键字有哪些、如何处理、屏蔽条件等等,本人不便细说。

    此外,网络分类信息平台还可以通过与传统平台的合作,引入经过验证或审核的数据作为发布数据源,整体提升平台的信息真实度。

    最后,如果要一定要谈“关键问题”,本人认为互联网分类信息的“关键”是如何加快用户对海量数据的处理和优化搜索的页面信息数。