SEO网络优化入门教程

- 灬无言 - 阅 6,563

在搜狗站长平台上,没有找到类似于百度、360和谷歌算法的说明,但有一些官方给出的基础的站长课堂。小小课堂网认为,搜狗站长课堂讲解的一些基本知识点,对SEO人员有着的指导性作用,尤其是对SEO技巧走火入魔的家伙们。

今天,小小课堂网为大家带来的就是搜狗站长课堂的SEO网络优化入门教程以及个人的一些观点。希望对大家有所帮助。网络SEO可以帮助我们更好的工作。

搜狗站长SEO网络优化入门教程

一、搜索引擎工作原理

小小课堂观点:搜索引擎工作原理是每一个SEO人员应该了解的基本知识。

往期教程《搜索引擎是如何工作的?》。

  • 抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(Spider)。爬虫顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
  • 处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
  • 提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
  • 提交网站搜索。站长主动向搜索引擎提交网址,它在一定时间内定向向你的网站派出爬虫,扫描你的网站并将有关信息存入数据库,以备用户查询。由于搜索引擎索引规则相对于过去已发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此站长应该在网站内容上多下功夫,并让搜索引擎有更多机会找到你并自动将你的网站收录。
  • 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
我们想说的是您应该将您优化的重心和出发点主要放在用户体验上,因为用户才是您网站内容的主要受众,是他们通过搜索引擎找到了您的网站。过度专注于用特定的技巧获取搜索引擎自然搜索结果的排名不一定能够达到您想要的结果。

二、网站优化基本概念

小小课堂观点:这些是SEO人员必须掌握的基本知识。

以往教程《SEO页面优化方案》、《robots.txt文件规则》、《robots优化WordPress和dedecms织梦网站》、《SiteMapX使用教程_免费制作网站地图工具》、《301 404 302 200 500 HTTP状态码代表什么意思?》。

搜索引擎优化Search Engine Optimization

是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。主要工作原则是,通过了解各类搜索引擎抓取互联网页面、进行索引以及确定其对特定关键词搜索结果排名等技术,来对网页进行相关的优化。
请不要针对搜索引擎而采用作弊行为,否则会受到处罚。参见作弊问题。仅仅是模仿甚至抄袭别人的内容,这样对用户来说没有价值的。请牢记:为用户,而不是为搜索引擎提供内容。您网站的设计首先要考虑用户的需求,并同时确保能便于搜索引擎抓取和索引。

站点地图Sitemap

sitemap可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页。常见的sitemap文件,就是txt、xml、xml一级索引这三种格式文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。

Robots协议

Robots协议(也称为爬虫协议、爬虫规则、机器人协议等)也就是robots.txt,网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。Robots协议是网站国际互联网界通行的道德规范,其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯。因其不是命令,故需要搜索引擎自觉遵守。您可以使用robots.txt禁止spider抓取您不想向用户展现的形式,这也有助于节省您的带宽。

元标签

是使用在网页的head标签之间的一种HTML标签,主要包括关键词标签和描述标签,现在最常用的也是这两类。与其它的HTML标签不同,元标签不会在页面的任何地方显示出来,所以绝大多数的访问者并不会看到它的存在,而且对网站的权威度没有影响,不过仍然是有好处的,特别是在与搜索引擎的spider交流的时候。不同的元标签起着不同的作用——但均用来提供关于页面的附加信息。

网页标题Title

是对一个网页的高度概括,一般来说,网站首页的标题就是网站的正式名称,而网站中文章内容页面的标题就是文章的题目,栏目首页的标题通常是栏目名称。您网站首页的标题可以列出网站或者公司名称和其他一些重要的信息,诸如您公司的实际地址,一些主要关注的领域或者提供的服务。
搜狗建议站长不要利用网页标题进行恶意作弊,类似于一些网站正文内容与标题不符,或者标题过长、关键词堆砌的网站,我们不会保证收录,甚至可能处罚。

面包屑导航

是指在网页顶端或者底部放置的一排内部链接,它使用户可以方便地回到上一层结构中的网页或者主页。大多数面包屑导航通常会从最具概括性的页面开始(通常是主页),越往右指向的页面内容越具体。

Alt属性

是一个用于网页语言HTML和XHTML、为输出纯文字的参数属性。它的作用是当HTML元素本身的物件无法被渲染时,就显示alt(替换)文字作为一种补救措施。当图片因为一些原因不能够显示的时候,alt 属性使您可以指定供替换显示的文字。
为什么使用这个属性呢?如果一个用户在浏览您的网站的时候使用的浏览器不支持图片,或者用户在使用一些类似于屏幕阅读器的设备时,alt 属性的内容就可以提供关于图片的信息。除此之外,使用alt属性还有另一个原因。如果您把一张图片作为一个链接,此时这个图片的alt属性就能起到与文本链接的锚文本相同的作用。

锚文本Anchor Text

就是链接文本,是链接的一种形式,即是链接上可以被点击的文字。锚文本可以做为锚文本所在页面内容的评估。正常来讲,页面中增加的链接都会和页面本身的内容有一定的关系。

Heading标签

Heading标签也叫做H标签,HTML语言里一共有六种大小的heading 标签,从最重要的<h1>到<h6>,权重依次降低。是网页html中对文本标题所进行的着重强调的一种标签。

Http状态码

  • 301:(永久移动)请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。
  • 302:代表暂时性转移(Temporarily Moved)。
  • 403:资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致,比如IIS或者apache设置了访问权限不当。
  • 404:请求失败,请求所希望得到的资源未被在服务器上发现。404这个状态码被广泛应用于当服务器不想揭示到底为何请求被拒绝或者没有其他适合的响应可用的情况下。出现这个错误的最有可能的原因是服务器端没有这个页面。

 三、网站内容

小小课堂观点:强调原创优质内容和友链作用。友链一定要相关性高,权重相当。

以往教程《SEO原创文章、伪原创文章和转载文章》、《外链还有用吗?》、《外链建设方法与原则》。

网站内容建设的原则是什么?
请站长们提供独特且相关的内容,使用户有理由首先访问您的网站。搜狗更喜欢独特的原创内容,如果您的站点内容只是从各处采集复制而成,很可能不会被收录。
使用友情链接对网站的收录影响?
友情链接,是具有一定资源互补优势的网站之间的简单合作形式,即分别在自己的网站上放置对方网站的LOGO图片或文字的网站名称,并设置对方网站的超链接(点击后,切换或弹出另一个新的页面),使得用户可以从合作网站中发现自己的网站,达到互相推广的目的,因此常作为一种网站推广基本手段。
友情链接交换有哪些方面的意义呢?
  • 提升网站流量。友情链接的好处不在于可以给您的网站带来多少直接的访问量,而在于它会让搜索引擎更多的收录您的网页。
    实际上,这条几乎可以忽略不计,但是很多新人有个误区,以为换友情链接是为了增加流量,所以在这里严重纠正一下,友情链接对于流量的提升帮助非常小。
  • 完善用户体验。通常来说,友情链接交换都是介于同行之间,这利于用户直接通过网站访问另一个同行的站点,以便于更直接简单地了解全面的信息。
  • 提升PR。这是交换友情链接最根本的目的,通过提升PR能让一个网站的盈利与收入发生较大的变化。
  • 提高知名度。这是有针对性的,对于一些特定的网站和特定的情况,才会达到此效果。如一个不知名的新站,如果能与google、搜狐、腾讯等大的网站全都做上链接的话,那肯定对其知名度及品牌形象是一个极大的提升。
  • 吸引蜘蛛爬行。如果友情链接做得好,能吸引蜘蛛从高质量的网站爬到自身网站,使蜘蛛形成爬行循环,让引擎给自身网站高的评价,对收录以及快照更新有帮助。
请谨慎设置您的友情链接,如果您网站上的友情链接,多是指向一些低质量的、甚至是垃圾或者涉及作弊的站点,那么您的站点可能会受到一些负面影响。
内容联盟会导致自己的网站收录下降吗?
由于搜索引擎越来越智能化,内容联盟无疑是将一份内容复制给多个网站,这正是搜索引擎不认可的. 如果您网站的内容在网络上已经被重复千百遍,你的内容可能不会被搜索引擎收录,这也是为什么很多站长反映自己网站不被收录或收录减少的原因之一。

 四、网站设计

小小课堂观点:网站结构清晰合理,关键词合理布局。

以往教程:《SEO网站结构优化》、《搜索词与关键词的区别及其在SEO优化中的价值》、《SEO网站关键词优化难度分析》、《SEO关键词挖掘的十四种方法》、《如何选取关键词?》、《SEO关键词布局》。

网站的结构和导航设置应该注意什么?
  • 每个网页都需要有合适的标题,网站首页标题建议使用站点名称或者站点代表的公司、机构名称;其余的内容页面,标题建议做成与正文内容的提炼和概括,建议格式“页面标题_站点名称”,这可以让您的潜在用户通过搜索引擎结果中的标题快速访问到您的页面。
  • 充分利用网站首页或者频道首页的 description 标签,提供此网页内容的概括说明,形式为<meta name=”description” content=”此网页内容的概括说明” />,这将帮助用户和搜索引擎加强对你的网站和网页的理解。
  • 网站应该有明晰的导航和层次结构,网站上重要的网页,应该能从网站比较浅层的位置找到,确保每个页面都可以通过至少一个文本链接到达。
  • 为用户提供包含指向网站重要部分的链接的站点地图。如果站点地图中包含的链接数量过多,您应将该站点地图分成多个网页。
搜索引擎对frame和iframe框架是否友好?
  • 首先,Frame和iframe代码框架的意思是在当前页面中插入另一个页面,可以说是调用也可以说是使用代码插入。比方我们在的页面为a.html 对于a.html的页面我们存在不满意,但是为了达到某种目的。而再创建以个页面b.html 然后把b.html用js调用的方式或是其他div以及代码方式插入到a.html 。可以理解为b.html是当前页面中(a.html)的独立子页面,与父页面同时展示。
  • 需要注意的是,iframe结构在部分IE内核的浏览器中打开时会造成CPU的负担,当页面上iframe内容过多时可能导致浏览器崩溃和CPU占用率过高。
  • 搜狗并未对iframe和frame框架有针对性策略。但是如果是纯粹的拼接内容网站,将会被严惩。
关键词设置要注意什么?
  • 考虑因素。首先要考虑用户可能使用什么关键词来查找您的网页,考虑用户是网站建设好的重要因素。对于新上线的网站来说,搜索引擎仍旧是获取流量的主要途径,而关键词设置的是否合理,又是网站能否捕捉到流量的关键。
  • 变动幅度。网站的关键词是对网站中心的缩写描述,通过网站关键字你就能大概知道网站的内容方向。所以对于Spider来说,抓取网站时要看你的标题、关键词、描述。其中关键词在网站上线前要求设定完成,在后期最好不要变动,这样搜索引擎会留下对你网站稳定的态度,是想一个网站内容主旨不定,经常变动的网站,搜索引擎又怎么能很好的评估你的网站呢?
  • 在网站中的布局。总的来说,关键词的选择要以大方向为主,次生关键词为辅,长尾关键词兼顾的方法进行选择。
关键词只是一个网站的大概描述,虽然有很多的好处,但是切记不要大量堆积。搜狗对于关键词堆砌作弊的网站会进行处罚。
网页如果改版或者更换域名了怎样让搜狗知道,尽可能的减少对网站的影响呢?
  • 首先这两者都需要涉及到301重定向。网站改版或者网站内重要页面链接发生变动时,应该将改版前的页面301永久重定向到改版后的页面。
  • 网站更换域名,应该将旧域名的所有页面301永久重定向到新域名上对应的页面。域名变换后您可以通过站长平台提交域名变换规则告知搜狗搜索您的站点已经更换域名。

 五、爬虫抓取

小小课堂网观点:爬虫知识在分析网站日志时是必备的。

以往教程《网站日志在哪里?Windows Server 2012》、《IIS网站日志分析详解》。

sogou spider User-Agent字段是什么?
  • PC端UA为
    Sogou web spider
    Sogou inst spider
    Sogou spider
  • 无线端UA为
    Sogou wap spider
请注意,根据标准,ua区分大小写。

搜狗spider的IP有哪些?
    • 搜狗暂不对外提供搜狗spider IP列表,但您可以通过DNS反查IP的方式判断某只spider是否来自搜狗搜索引擎。根据不同平台有不同的验证方法。
    • linux平台:
      命令为host ip,如下图。搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。

搜狗蜘蛛

  • 在windows平台或者IBM OS/2平台:
    命令为nslookup ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。
  • mac os平台:
    命令为dig ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。

sogou spider 如何反应我网站上页面的更新?
sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面。

搜狗spider的抓取频次是怎样的?
  • sogou spider 对于同一个 IP 地址的服务器主机,只建立一个连接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天以后才会去更新。如果持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的链接。
  • 如果您认为 sogou spider 对于您的网站抓取过快,请与我们联系,并最好能提供访问日志中sogou spider 访问的部分,而不要直接将搜狗spider的ua封禁。
sogou spider 喜欢收录什么样的页面
  • 内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
  • 链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
  • 如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。

六、收录索引

小小课堂网观点:优质原创内容+规律持久的更新频率+合理的网站结构=持续增长的收录量。违规操作会严重降低收录量。

以往教程:《百度沙盒和Google沙盒效应是什么?》。

新站建立后,需要多长时间能够被搜狗收录?
收录时间是根据您的网站质量、类型等综合因素考虑的。比如大型的新闻站、优质站点、地方优质门户网站,新站建立后能够达到秒级的收录;再往下一级的普通站点则需要天级;低质量站点的收录时间会达到周级以上甚至不保证收录。
新站建立很长时间后,若未被搜狗收录,请到站长平台提交网站收录。

收录、索引和site检索结果数之间的关系 ?
  • 搜狗的收录量是搜狗抓取网站的页面数;而索引量是指网站被收录的页面中,筛选出更为优质的、进入索引库的页面。因此常会出现索引量低于收录量的现象,这是正常的,站长们可以不用担心。
  • 搜狗的site检索是一个预估的放出页面数,既不是收录量,也不是索引量,查询收录、索引以站长平台的网站分析工具的数据为准。
  • 如果收录量与索引量差异较大,一般是新站。如果是站的时间比较长,那就是网站的部分网页不再达到选入索引库的要求。互联网的网页每天都在增多,优质网页更是如此,如果您不坚持提升您的网站质量,重在为用户提供价值,那很有可能搜狗就会索引其他更好的网站。
  • 针对新站,如果索引量比较少,收录量的数据比较大,并且在逐渐增多,这是一个好的现象,说明你的新站收录和索引正常,过一段时间这些收录页面会被陆续的放出来。

为什么我的网站收录量下降?
  • 原因一:搜狗策略更新调整,对于搜狗引擎来说,更新调整是必须的,这才能不断提高用户得到的搜索结果的质量,一般的更新调整对于质量正常的网站的流量和排名并不大,此时小幅度的下降并不影响大局;但是对于质量本身存在问题的网站,如大篇幅影响正文阅读的广告、涉及色情、涉枪涉暴、违法乱纪等网站,这类网站往往会被策略的更新调整直接影响,这种情况下站长需要坚持提升网站质量,坚持非恶意优化,才能重新获得好的收录。
  • 原因二:网站被黑,有时会存在由于服务器不稳定,导致网站被入侵的现象。对于被黑,站长课堂中也有网站被黑的相关模块。
  • 原因三:文章质量,这个是搜狗强调过多次,也是大部分站长不明白自己收录下降的原因。例如搜狗工作人员每天收到的反馈中,有一些新闻或者咨询站收录下降。经过我们的仔细排查,发现是网站文章质量的问题,虽然站长强调每日更新编辑,但是这些文章在互联网上重复率极高,且质量还不高。现在的伪原创,一般搜索引擎都是能够识别。除了采集文章,还有其他的如大篇幅影响正文阅读的广告、涉及色情、涉枪涉暴、违法乱纪、淘宝客、私服等。所以收录下降,站长们首先检查是不是自身网站质量问题。
  • 原因四:有的网站不是减少收录,而是以前每天发布5篇,可以收录3篇,然而如今发布5篇只有1篇收录,甚至一篇都没有收录,这也算做是收录减少。经过分析,一般网站有过大改版,原来的网站一些程序和结构都改变了,搜狗爬虫对你的网站不熟悉了,来的次数就少了,自然收录就下降了。所以网站一但做稳做好,不要轻易改版。即使一定要改版,可以一步一步的改,老的内容也不要一次性删除掉。
  • 原因五:网站有恶意优化的嫌疑,导致收录减少,搜狗建议大家做内容导向的网站,把心思放在提高网站质量上,这样就不怕搜索引擎K站或者处罚。
针对网站的收录减少的问题,大家要学会自己分析问题,不要一味地去抱怨搜索引擎。只有自己找到原因才能更加容易的解决这方面的问题,网站能够被大量收录,对你内页大量关键词排名是很有好处的。但如果网站的收录量急剧减少,甚至索引量只有1,可能是站点由于改版或者被黑而导致了不收录,请到站长平台进行网站申诉。
为什么我的网站以前收录很快,现在收录慢了?
如果您的站以前发布新文章收录快,而现在发布新文章收录得慢甚至不收录。可能的原因是搜狗微调了收录策略,而现在收录慢的网站均是未达到实时收录(秒级)要求的网站。如前所述,大型的新闻站、优质站点、地方优质门户网站,内容更新后才能够达到秒级的收录。
若发生此类情况,站长们应该第一时间反省自己的网站是否达到了实时收录的要求,若确实符合要求,再进行申诉。
301重定向对收录、索引、site检索的影响?
  • 页面永久性移走(301 重定向)是一种非常重要的“自动转向”技术。301重定向可促进搜索引擎优化效果,从搜索引擎优化角度出发,301 重定向是网址重定向最为可行的一种办法。
  • 当网站的发生301后,建议站长向平台提交域名变更。提交域名变更后,这时由于新域名各方面数据较少,此时搜狗会按照旧域名的收录、索引等展现在site检索新域名的结果下。但随着时间的推移,旧域名的收录、索引等数据会下降,而新域名的收录、索引等数据会上升。再这样进行转换必定是不科学的,因此搜狗会在一段时间后按照新域名的收录、索引等数据展现在site检索的结果下。
  • 过去的一段时间有大量SEO工作者滥用301和302技术作弊,并在搜狗站长平台提交域名变更以提高排名,致使搜索引擎现在对重定向技术很不友好,并且现在这样的操作已经不会起作用了,所以在考虑做重定向之前一定要考虑清楚是否有这个必要。

七、作弊问题

小小课堂网观点:SEO没有所谓的捷径与快速提升排名,如果有,那么离降权或K站就不远了。

以往教程:《SEO作弊手段有哪些?》。

搜狗对作弊网站的定义是什么?
  • 作弊网站是指在网页设计中,为了提升网页在搜索引擎中的排序而做的欺骗搜索引擎的行为。
  • 这种做法导致的结果是或许您的网站会在短时间内(搜狗未发现您的作弊行为前)会有所提升,但最终会以被降权或封禁作为对您网站的惩罚而告终。作弊会严重影响用户体验,一经发现,搜狗会对作弊站点进行严厉打击,包括降权以及封禁。处罚时间最短为60天,整顿完成后可进行网站申诉,申诉后工作人员会在20~30个工作日内对您的站点质量进行评估,整顿达到标准后可恢复收录或恢复部分收录。
请注意,解除处罚的网站一旦被发现再次作弊,将会受到更为严厉的处罚,可能导致永久封禁。

常见的搜狗反对的作弊行为有哪些?
  • 隐藏文本/隐藏链接。一般指网页专为搜索引擎所设计,但普通访问者无法看到的文本内容或链接。在形形色色的隐藏技术中,最常见的就是把文本或链接文字的字体颜色设置为与背景色相同或十分接近。其他方法包括使用超小号文字、文字放在图片层的后面、页面底部下出现的多余内容、滥用图片 ALT 等;
  • 网页与搜狗描述不符。一般发生于先向搜索引擎提交一个网站,等该网站被收录后再以其它页面替换该网站。常见的“诱饵行为”就属于此类偷梁换柱之举——创建一个优化页和一个普通页,然后把优化页提交给搜索引擎,当优化页被搜索引擎收录后再以普通页取而代之。
  • 误导性关键词。在页面中使用与该网页毫不相干的误导性关键词来吸引查询该主题的访问者访问网站。这种做法严重影响了搜索引擎所提供结果的相关性和客观性,为搜索引擎所深恶痛绝。
  • 重复性关键词。这种作弊技术也被称为“关键词堆砌欺骗”,它利用搜索引擎对网页正文和标题中出现的关键词的高度关注来对关键词进行不合理的(过度)重复。类似的其它做法还包括在HTML元标识中大量堆砌关键字或使用多个关键字元标识来提高关键词的相关性。这种技术很容易被搜索引擎察觉并受到相应惩罚。
  • 恶意互换链接。在网页中互相建立大量指向对方网站的链接。
  • 隐形页面。对实际访问者或搜索引擎任一方隐藏真实网站内容,以向搜索引擎提供非真实的对搜索引擎友好的内容提升排名。
  • 欺骗性重定向。指把用户访问的第一个页面(着陆页)迅速重定向至一个内容完全不同的页面。
  • 日志欺骗行为。是指通过对一些页面等级较高的站点进行大量的虚假点击以求名列这些站点的最高引用者日志中,从而获得它们的导入链接。
  • 建立大量镜像网站复制网站或网页的内容并分配以不同域名和服务器,欺骗搜索引擎对同一页面内容进行多次索引。
  • 页面包含恶意广告、恶意代码或恶意插件
  • 页面有链接指向作弊网站的可能会被视为作弊网站。
当有人很热情的要求你为他的站点提供友情链接时,搜狗提醒您请审视以下两点:
①对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
②对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使你的网站受到负面影响。

搜狗会怎样处罚作弊网站?
  • 搜狗反作弊系统会实时监控作弊网站,并根据作弊等级对作弊网站进行相应的处罚。
  • 常见处罚:降低网站在搜狗的整体排名;
  • 一般处罚:仅索引正常网页比如首页,其他网页不予收录;
  • 严厉处罚:包含非法内容及恶意程序、用户集中投诉的网站,搜狗将拒绝收录整个网站。
如何申请解除处罚?
  • 被搜狗视为有作弊行为的网站,在清除作弊内容后,可在站长平台中的网站申诉提交解除作弊处罚申请。
  • 搜狗工作人员会在收到申诉之后的20~30个工作日内对您的站点质量进行审查,如果确认网站已经不存在作弊行为,搜狗将恢复对该网站的正常收录。解除处罚的网站一旦被发现再次作弊,将会受到更为严厉的处罚,可能导致永久封禁。
需要说明的是,搜狗技术和产品部门只对用户搜索体验负责。以下的说法都是错误的和毫无根据的:
①我成为搜狗的广告客户或者联盟网站,就可以重新被收录。
②我给搜狗若干钱,就可以重新被收录。
③我认识搜狗的某某人,就可以重新被收录。

八、被黑问题

小小课堂网观点:选购安全性强的服务器、安全的网站程序、经常查看服务器漏洞和攻击等。

以往教程《网站日志在哪里?Windows Server 2012》、《IIS网站日志分析详解》。

什么是网站“被黑”?
  • 网站被黑,是指黑客利用网站的程序、设置等方面的安全漏洞或管理员安全疏忽(如密码复杂度低),未经管理员授权,对网站进行了篡改(例如添加垃圾内容或者添加其他网页)或者向网站注入恶意代码等。

如何知道是否“被黑”?
  • 分析系统日志、服务器日志,检查自己站点的页面数量、流量等是否有异常波动,是否存在异常访问或操作日志
  • 检查网站文件是否有不正常的修改,尤其是首页等重点页面。
  • 网站页面是否引用了未知站点的资源(图片、JS等),是否被放置了外站的异常链接。
  • 检查网站是否有不正常增加的文件或目录。
  • 检查网站目录中是否有非管理员打包的网站源码、未知txt文件等。

如何处理“被黑”?

步骤一避免问题扩大

    • 立即关停自己的网站以避免感染其他网站(如果您有权访问自己的服务器则最好将其配置为返回503状态代码)。
    • 与自己的网络托管商联系了解是否已经采取措施解决问题。
    • 更改所有用户和所有账户的密码(例如,FTP 访问密码、管理员帐户密码、内容管理系统授权帐户密码)。
    • 删除所有被串改或被恶意增加的页面,并通过搜狗站长平台通过死链提交告知我们删除搜狗搜索结果中的被黑数据。

步骤二评估损失

    • 使用最新的扫描程序扫描您的计算机,找出任何可能由黑客添加的恶意代码。请务必扫描所有内容,而不是仅扫描基于文本的文件,因为恶意内容往往会嵌入图片中。
    • 删除被黑的网页或网址。这样可防止系统向用户提供被黑的网页。
    • 向我们报告网上诱骗网页(http://fankui.help.sogou.com/index.php/web/web/index?type=5)
    • 查看 antiphishing.org(http://www.antiphishing.org/)中针对被黑的网站(http://docs.apwg.org/reports/APWG_WTD_HackedWebsite.pdf)的处理方法。
    • 如果您还有其他网站,请检查它们是否也已被黑。

步骤三如果有权访问自己的服务器,请继续以下步骤

    • 检查自己的网站中是否有已遭到攻击的开放重定向网址。
    • 根据所用的网站平台,检查 .htaccess 文件 (Apache) 或其他访问控制机制,以找出恶意更改。
    • 检查服务器日志,以查看文件被黑的时间(记住,黑客能更改日志)。查找是否有可疑的活动,例如失败的登录尝试、命令(尤其是以根用户身份发出的命令)历史记录或未知的用户帐户。

步骤四清理自己的网站

    • 清理自己的内容,根据病毒扫描程序识别结果删除黑客添加的所有网页、垃圾内容和可疑代码。如果您备份了内容,则可考虑彻底删除自己的内容,然后替换为已知的最新完好备份(已核实既无漏洞又不含被黑内容的一次备份)。

步骤五如果有权访问自己的服务器,请继续以下步骤

    • 将所有软件包都更新到最新版本。我们建议您使用可靠的来源彻底重新安装操作系统,以确保删除黑客篡改的所有内容。另外,如果安装了博客平台、内容管理系统或任何其他类型的第三方软件,请务必将其重新安装或进行相应更新。
    • 确信自己的网站不含漏洞后再改一次密码。
    • 将系统设置为可公开访问。更改服务器配置,使其不再返回 503 状态代码,并且采取所有其他必要措施向公众开放自己的网站。

步骤六申请解除屏蔽

  • 当您按照以上提示仔细排除异常后,可以告知我们(http://zhanzhang.sogou.com/index.php/sitefb/addShensu)告知我们您的站点已经清理完毕被黑数据。申请解除对您网站的屏蔽,在未完全排除全部异常的状态下提交申请将无法通过我们的检查,进而无法解除屏蔽。
  • 网站申诉处理周期一般为20~30个工作日,工作人员将会对您的站点内容进行检测,当确定完全排除全部异常状态之后,您的站点会解除屏蔽。
如何防止“被黑”?
  • 定期检查服务器日志等方式发现问题,检查是否有可疑的针对非前台页面的访问。
  • 经常检查网站文件是否有不正常的修改或者增加。
  • 关注操作系统,以及所使用程序的官方网站。及时下载补丁,修补安全漏洞;必要时建议直接更新至最新版本。
  • 修改开源程序关键文件的默认文件名,作弊者通常通过程序自动扫描某些特定的文件是否存在来判断是否使用了某套程序。
  • 修改默认管理员用户名,提高管理后台的密码强度,使用字母、数字以及特殊符号多种组合的密码。
  • 关闭不必要的服务以及端口
  • 关闭或者限制不必要的上传功能。
  • 设置防火墙等安全措施。
  • 若问题反复出现,建议重新安装服务器操作系统,并重新上传备份的网站文件。
  • 缺乏专业维护人员的网站,建议向专业安全公司咨询。

九、网页快照

小小课堂网观点:快照更新的不及时,证明我们的网站需要增加友链和优质外链,吸引更多的蜘蛛来访,同时更新网站优质原创内容。

以往教程:《什么是百度快照?对SEO优化有用吗?》。

什么是网页快照?
  • 网页快照,英文名叫WebCache,网页缓存。搜狗在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜狗将搜狗Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
  • 互联网上的网页并不是一成不变的,而是不断增加、删除、改动。因此,搜狗网页数据库中的网页也需要及时更新,既把互联网上网页重新复制一遍。
  • 如果你在你的网站上删除一张网页,那么搜狗数据库中的复制品-网页快照并不会立刻被删除,而是要过一段才会被删除。

内容变更/快照内容错误怎么办?
  • 如果网页内容(无论是内容还是网页标题或者其他信息)已经更改或者发现搜狗网页快照与您的网页内容不一致,在我们下次抓取网站并刷新索引前,网页快照仍然会包含原有的内容。因而这些内容仍然会出现在搜索结果中,您可以申请更新快照(http://fankui.help.sogou.com/index.php/web/web/index?type=2)来告知搜狗更新快照信息。

从搜狗永久删除内容如何操作?

情况一网页已不存在

    • 如果网页已不存在,请确保服务器返回 404(未找到)。这样可让搜狗知道该网页已不存在,无需再在搜索结果中显示。

情况二网页仍存在

    • 请使用 robots.txt 阻止 sogou spider 进行抓取。请注意,在通常情况下,即使您已通过 robots.txt 禁止抓取某个网址,但如果我们在其他网站中发现该网址,仍会将相应网页编入索引。这里需要说明一点,如果页面变死链了,并且设置了robots.txt,那么搜狗的spider就不会再来更新,也就不知道这个页面变死链。

情况三删除非 HTML 格式的文件

  • 如果要从搜索结果中删除非 HTML 格式的文件(例如可下载的 PDF),则您或网站站长应确保从服务器中删除该文件。
我想从搜索结果中删除整个网站或某个目录的内容?

情况一您是网站拥有者

    • 如果您是网站拥有者,则需要在验证网站所有权后申请删除整个网站或目录。
    • 为确保永久删除您的目录或网站,请使用 robots.txt 阻止抓取工具访问该目录(如果要删除的是网站,则应阻止抓取工具访问您的整个网站)。我们建议您在请求删除目录前或请求删除后不久执行该操作。否则,您的内容稍后可能会重新显示在搜索结果中。仅返回 404 HTTP 状态代码还不够,因为可能出现这样一种情况:即某个目录返回了 404 状态代码,却仍然分发其中的文件。通过使用 robots.txt 禁止抓取目录,可确保将目录的所有子项也一并排除。
    • 完成上述某步操作后,您就可以发出删除请求,从搜索结果中删除相应目录及其所有内容。删除 https://www.example.com 的同时还会删除 http://www.example.com,以及http://example.com 和 https://example.com。

情况二您不是网站拥有者

  • 如果您不是网站拥有者,请通过网站联系网站管理员,要求他通过以上步骤进行删除。搜狗没有权利控制互联网中的内容。

以上引用内容全部来自搜狗站长平台的《站长课堂》。小小课堂网做了观点的阐述和以往SEO教程的推荐。感谢您的观看。

如需购买系统的SEO及新媒体运营视频教程(提供一对一指导),联系QQ:2216876660  微信:huowuyan

喜欢记得,点赞,打赏哦。小小课堂,每天一个IT原创视频和图文教程,别忘了关注哦。

扫描二维码关注“小小课堂网”

第一时间获取最新教程

二维码

18

本文转载 " www.xxkt.org "

原文地址 " 小小课堂网原创教程。未经许可,禁止转载。否则,将追究法律责任! "

相关文章!

发表评论

电子邮件地址不会被公开。 必填项已用*标注

error: Content is protected !!