S 百度站长平台:谈谈原创项目那点事_卖家电商杂谈_门别卖家论坛
收藏夹门别网 天猫商城网店出售转让 淘宝网店转让出售 京东店铺出售 网店买卖交易平台  


zhangxibaobao8 等级:1 / 门别币:20
发表:2016-3-14 13:34:28  查看:1845  回复:3
百度站长平台:谈谈原创项目那点事



不管是老站还是新站,原创都是十分重要的存在。
  抄过来的内容,网站不喜欢,搜索引擎也不喜欢。
  今天咱就来说说这原创。
  
  一、搜索引擎为什么要重视原创  1.1采集泛滥化  来自百度的一项调查显示,超过80%的新闻和资讯等都在被人工转载或机器采集,从传统媒体的报纸到娱乐网站花边消息、从游戏攻略到产品评测,甚至高校图书馆发的催还通知都有站点在做机器采集。
  可以说,优质原创内容是被包围在采集的**大海中之一粟,搜索引擎在海中淘粟,是既艰难又具有挑战性的事情。
    1.2提高搜索用户体验  数字化降低了传播成本,工具化降低了采集成本,机器采集行为混淆内容来源降低内容质量。
  采集过程中,出于无意或有意,导致采集网页内容残缺不全,格式错乱或附加垃圾等问题层出不穷,这已经严重影响了搜索结果的质量和用户体验。
  搜索引擎重视原创的根本原因是为了提高用户体验,这里讲的原创为优质原创内容。
    1.3鼓励原创作者和文章  转载和采集,分流了优质原创站点的流量,不再具属原创作者的名称,会直接影响到优质原创站长和作者的收益。
  长期看会影响原创者的积极性,不利于创新,不利于新的优质内容产生。
  鼓励优质原创,鼓励创新,给予原创站点和作者合理的流量,从而促进互联网内容的繁荣,理应是搜索引擎的一个重要任务。
    
  二、采集很狡诈,识别原创很艰难  2.1采集冒充原创,篡改关键信息  当前,大量的网站批量采集原创内容后,用人工或机器的方法,篡改作者、发布时间和来源等关键信息,冒充原创。
  此类冒充原创是需要搜索引擎识别出来予以适当调整的。
    2.2内容生成器,制造伪原创  利用自动文章生成器等工具,“独创”一篇文章,然后安一个吸引眼球的title,现在的成本也低得很,而且一定具有独创性。
  然而,原创是要具有社会共识价值的,而不是胡乱制造一篇根本不通的垃圾就能算做有价值的优质原创内容。
  内容虽然独特,但是不具社会共识价值,此类伪原创是搜索引擎需要重点识别出来并予以打击的。
    2.3网页差异化,结构化信息提取困难  不同的站点结构化差异比较大,html标签的含义和分布也不同,因此提取关键信息如标题、作者和时间的难易程度差别也比较大。
  做到既提得全,又提得准,还要最及时,在当前的中文互联网规模下实属不易,这部分将需要搜索引擎与站长配合好才会更顺畅的运行,站长们如果用更清晰的结构告知搜索引擎网页的布局,将使搜索引擎高效地提取原创相关的信息。
   百度站长平台:谈谈原创项目那点事

给楼主点动力吧,已有 2 个人对这内容打赏,关于打赏说明.


收藏主题
推荐连接:淘宝网店价值评估天猫网店评估淘宝0信誉店铺

内容违规投诉举报请联系在线客服QQ:278336453
更多内容>>

下载APP客户端,随时随地上门别,方便卖家网店交易


暂还没有回复,请坐沙发,第一个吃螃蟹吧
  1   首 页
微信卖家交流群

微信扫一扫,纯粹电商人微信交流群,欢迎加入