WordPress特定文章对搜寻引擎暗藏或只容许搜寻引擎查看

对搜寻引擎暗藏特定的文章
这个成绩的起源是这样的:

家喻户晓,随着搜寻引擎的改进,会越来越排挤采集和伪原创,尤其是百度还推出了来源算法,对采集站进行K站等措施。假如被贴上采集站的标签,一切的致力可能付诸东流。

置信很多站长,也想多一些原创内容,并不想全副靠采集他人的文章。但是一个新站,尤其是集体站长,其内容的空虚速度肯定很慢,咱们做站不只要讨好搜寻引擎,更要讨好读者。假如读者不能在你的站内失去比拟空虚丰厚的信息,那体验一定不好。其实各小名站老站,一样有相当比例的采集或改编内容,这合乎互联网的共享肉体。各大电视台和报纸也大局部是转载和文摘,只需摘得好合乎了特定需要的内容需求,就是有价值的。

要害在于:不要用采集的文章来为本人的网站骗取搜寻流量。这应该是合乎互联网品德标准和共识的。假如只让原创的内容参加搜寻引擎的游戏规定,而非原创局部屏蔽搜寻引擎。这样就能平称地满足搜寻引擎、网站主、用户三者的利益。

于是成绩归结于一点:如何无效地、牢靠地让“局部文章屏蔽搜寻引擎”?

我不晓得这是不是一个比拟个性的成绩,假如一个网站,既心愿经过丰厚的文章来满足受众,但又怕被搜寻引擎判别为采集站,那这个就是一个真逼真切要面对的、要害的、外围的、关系到网站生活倒退的大成绩。

最近也不断在学习相干方面的常识,以集体高见,屏蔽搜寻引擎有几类形式:
一、用robots.txt
二、WP的站能够判别用户特色(看了你这篇博文后想到的)
三、经过JS封装链接
四、经过重定向,比方短链接、PHP后盾重定向等

比照以上几种形式,
**种办法:robots.txt好比在门上贴了封条:“嘿,蛛蛛,我这儿有些内容是不让你检索的”。这是所谓小人协议,搜寻引擎肯定有才能去看你贴着封条门内的货色,只是它不收录罢了。为了判别一个站能否有大量的采集内容,蛛蛛或者会有窥探的动机。

这种办法技术完成的老本**,也应该能满足大少数状况。好象百度在这方面的操守还是能够释怀的,比方不索引淘宝的内容,而且也很痛恨360对百度内容的索引。

这个办法进一步的成绩是:
在WP建的站中,如何能够高效率地让“局部文章屏蔽搜寻引擎”?
1、文章题目加特色:比方每篇文章的题目中加一个非凡字符,这个办法可行吗,robots.txt用disallow:*非凡字条*就能够吗?
2、文章的标签辨认:这个在操作层面好象是最最不便的,可是标签仿佛是静态的标志,无奈在robotx.txt中挑选?
3、文章放进特定的目录:这个robots.txt比拟好写的,但是在WP文章内容治理时如何繁难地操作?

第二种办法:好比是查看进门者的身份证,假如拜访者是搜寻引擎,那么就制止通行。这种办法是对WP公用的,而后它的益处是能够十分具体地域别看待,比方百度对采集的态度比拟紧,而GOOGLE不太一样,那有些文章就能够对百度关门而对谷歌开门。另外一个比拟大的优点是,能够把判别集成在WP环境中,比方经过插件或主题让操作主动化。

第三种办法:好比是在门上换了一个门牌,搜寻引擎只晓得机械地去跟踪门牌上的号码,而阅读器却经过JS把门牌指向到另一个正确的入口了。但是:搜寻引擎对JS的剖析才能可能越来越强了,而且从谷歌的某些申明中来看,搜寻引擎也不太喜爱你的内容对人和搜寻引擎不一样。
这个办法大量地用在淘宝客链接的暗藏方面,这个办法的无效期预计不太长,而且操作比拟费事,比拟适宜动态的独自页面,不太适宜WP这样的数据库组织文章的架构。

第四种办法:好比是给门牌号加了密,只有你敲门(点击)了,才给你换成正确的门牌号。普通的拜访者肯定会点击,而搜寻引擎不会模仿点击这个举措。
这种办法**彻底和“平安”,缺陷是:
1、和第三办法一样操作有些复杂,适宜动态的独自页面,或页面中部分的链接,不太适宜WP的环境。
2、过多的重定向,应该会耗费效劳器的运算资源,千里之行;始于足下,假如大量的文章都要进行一次重定向,效劳器可能会不堪重负。

完成代码

详细怎样完成WordPress 对搜寻引擎暗藏特定的文章呢?废话不多说,间接上PHP代码,放到以后主题的functions.php中即可应用(用UTF-8编码另存为):

// 需求阐明的是,假如你的WordPress站点开启了页面缓存,此性能有效

function ludouse_add_custom_box() {
 if (function_exists('add_meta_box')) {  
  add_meta_box('ludou_allow_se', '搜寻引擎', 'ludou_allow_se', 'post', 'side', 'low');
  add_meta_box('ludou_allow_se', '搜寻引擎', 'ludou_allow_se', 'page', 'side', 'low');
 }
}
add_action('add_meta_boxes', 'ludouse_add_custom_box');

function ludou_allow_se() {
 global $post;
 
 //增加验证字段
 wp_nonce_field('ludou_allow_se', 'ludou_allow_se_nonce');
 
 $meta_value = get_post_meta($post->ID, 'ludou_allow_se', true);
 if($meta_value)
  echo '<input name="ludou-allow-se" type="checkbox" checked="checked" value="1" /> 屏蔽搜寻引擎';
 else
  echo '<input name="ludou-allow-se" type="checkbox" value="1" /> 屏蔽搜寻引擎';
}

// 保留选项设置
function ludouse_save_postdata($post_id) {
 // 验证
 if ( !isset( $_POST['ludou_allow_se_nonce']))
  return $post_id;

 $nonce = $_POST['ludou_allow_se_nonce'];

 // 验证字段能否非法
 if (!wp_verify_nonce( $nonce, 'ludou_allow_se'))
  return $post_id;

 // 判别能否主动保留
 if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE) 
   return $post_id;

 // 验证用户权限
 if ('page' == $_POST['post_type']) {
  if ( !current_user_can('edit_page', $post_id))
   return $post_id;
 }
 else {
  if (!current_user_can('edit_post', $post_id))
   return $post_id;
 }
 
 // 更新设置
 if(!empty($_POST['ludou-allow-se']))
  update_post_meta($post_id, 'ludou_allow_se', '1');
 else
  update_post_meta($post_id, 'ludou_allow_se', '0');
}
add_action('save_post', 'ludouse_save_postdata');

// 关于设置不容许抓取文章和页面
// 制止搜寻引擎抓取,前往404
function do_ludou_allow_se() {
 // 本性能只对文章和页面无效
 if(is_singular()) {
  global $post;
  $is_robots = 0;
  $ludou_allow_se = get_post_meta($post->ID, 'ludou_allow_se', true);

  if(!empty($ludou_allow_se)) {
   // 上面是爬虫Agent判别要害字数组
   // 有点简略,本人优化一下吧
   $bots = array(
      'spider',
      'bot',
      'crawl',
      'Slurp',
      'yahoo-blogs',
      'Yandex',
      'Yeti',
      'blogsearch',
      'ia_archive',
      'Google',
      'baidu'
      );
  
   $useragent = $_SERVER['HTTP_USER_AGENT'];
  
   if(!empty($useragent)) {
    foreach ($bots as $lookfor) {
     if (stristr($useragent, $lookfor) !== false) {
      $is_robots = 1;
      break;
     }
    }
   }

   // 假如以后文章/页面制止搜寻引擎抓取,前往404
   // 当然你能够改成403
   if($is_robots) {
    status_header(404);
    exit;
   }
  }
 }
}
add_action('wp', 'do_ludou_allow_se');

应用办法

胜利增加以上代码到以后主题的functions.php后,咱们就能够失常应用了,齐全傻瓜式。在WordPress后盾文章和页面的编辑页面,左边栏底部咱们能够看到这样的选框:

假如以后文章/页面需求制止搜寻引擎抓取,勾选即可。勾选后,当此文章/页面被搜寻引擎拜访时就会前往404形态,无任何内容。假如你不喜爱给搜寻引擎前往404,担忧死链太多影响SEO,能够将代码中的:

status_header(404);
exit;

改成:

echo "<meta name=\"robots\" content=\"noindex,noarchive\" />\n";

再将:

add_action('wp', 'do_ludou_allow_se');

改成:

add_action('wp_head', 'do_ludou_allow_se');

这样就间接在网页的head局部增加meta申明:

<meta name="robots" content="noindex,noarchive" />

通知搜寻引擎不要索引本页面、不要显示快照。需求留意的是,你的主标题录下的header.php中必需有以下代码:

wp_head();


设置文章只容许搜寻引擎查看
有些文章只是为了SEO才公布的,想让这些文章只容许搜寻引擎抓取,一般的访客无奈查看,在WordPress中如何做到?

完成代码

假如你的WordPress站点未开启页面缓存,这个需要也不难完成,咱们能够参考下面对搜寻引擎暗藏特定的文章中的代码,稍作修正即可。在以后主题的functions.php中增加以下php代码,用UTF8编码保留:

// 给文章和页面的编辑页增加选项
function ludouseo_add_custom_box() {  
 add_meta_box('ludou_se_only', '搜寻引擎专属', 'ludou_se_only', 'post', 'side', 'low');
 add_meta_box('ludou_se_only', '搜寻引擎专属', 'ludou_se_only', 'page', 'side', 'low');
}
add_action('add_meta_boxes', 'ludouseo_add_custom_box');

function ludou_se_only() {
 global $post;
 
 //增加验证字段
 wp_nonce_field('ludou_se_only', 'ludou_se_only_nonce');
 
 $meta_value = get_post_meta($post->ID, 'ludou_se_only', true);
 if($meta_value)
  echo '<input name="ludou-se-only" type="checkbox" checked="checked" value="1" /> 只容许搜寻引擎查看';
 else
  echo '<input name="ludou-se-only" type="checkbox" value="1" /> 只容许搜寻引擎查看';
}

// 保留选项设置
function ludouseo_save_postdata($post_id) {
 // 验证
 if ( !isset( $_POST['ludou_se_only_nonce']))
  return $post_id;
 $nonce = $_POST['ludou_se_only_nonce'];
 
 // 验证字段能否非法
 if (!wp_verify_nonce( $nonce, 'ludou_se_only'))
  return $post_id;
  
 // 判别能否主动保留
 if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE)
   return $post_id;
   
 // 验证用户权限
 if ('page' == $_POST['post_type']) {
  if ( !current_user_can('edit_page', $post_id))
   return $post_id;
 }
 else {
  if (!current_user_can('edit_post', $post_id))
   return $post_id;
 }
 
 // 更新设置
 if(!empty($_POST['ludou-se-only']))
  update_post_meta($post_id, 'ludou_se_only', '1');
 else
  delete_post_meta($post_id, 'ludou_se_only');
}
add_action('save_post', 'ludouseo_save_postdata');

function do_ludou_se_only() {
 // 本性能只对文章和页面无效
 if(is_singular()) {
  global $post;
  $is_robots = 0;
  $ludou_se_only = get_post_meta($post->ID, 'ludou_se_only', true);
  
  if(!empty($ludou_se_only)) {
   // 上面是搜寻引擎Agent判别要害字数组
   // 有点简略,本人优化一下吧
   $bots = array(
      'spider',
      'bot',
      'crawl',
      'Slurp',
      'yahoo-blogs',
      'Yandex',
      'Yeti',
      'blogsearch',
      'ia_archive',
      'Google'
      );
  
   $useragent = $_SERVER['HTTP_USER_AGENT'];
  
   if(!empty($useragent)) {
    foreach ($bots as $lookfor) {
     if (stristr($useragent, $lookfor) !== false) {
      $is_robots = 1;
      break;
     }
    }
   }
   
   // 假如不是搜寻引擎,就显示谬误信息
   // 已登录的用户不受影响
   if(!$is_robots && !is_user_logged_in()) {
    wp_die('您无权查看此文!');
   }
  }
 }
}
add_action('wp', 'do_ludou_se_only');

应用办法

胜利增加以上代码到以后主题的functions.php后,咱们就能够失常应用了,齐全傻瓜式。在WordPress后盾文章和页面的编辑页面,左边栏底部咱们能够看到这样的选框:

假如以后文章/页面需求制止搜寻引擎抓取,勾选即可。勾选后,当此文章/页面被一般访客拜访时就会显示上面的谬误信息(搜寻引擎和已登录用户不受影响):

以上就是安达网络工作室关于《WordPress特定文章对搜索引擎隐藏或只允许搜索引擎查看》的一些看法。更多内容请查看本栏目更多内容!

本文相关话题: WordPress 搜索引擎 PHP PHP编程
版权声明:本文为 安达网络工作室 转载文章,如有侵权请联系我们及时删除。
相关文章
WordPress评论中制止HTML代码显示的办法

本文实例讲述了WordPress评论中制止HTML代码显示的办法。分享给大家供大家参考。详细剖析如下: 应用WordPr...

WordPress博客效劳器环境配置

早就想搭建一个专属于本人的博客了,用来记载本人生存、学习的点点滴滴。之所以选WordPress,次要是由于它能...

WordPress的.htaccess优化技巧

目前.htaccess 文件的次要成绩是RewriteCond 指令性地反省磁盘文件能否存在,就算基本不需求反省,每一次拜...

WordPress完成网站投稿者也能够上传图片的办法

本文实例讲述了WordPress完成网站投稿者也能够上传图片的办法。分享给大家供大家参考。详细剖析如下: Word...

WordPress应用中文用户名的办法

在WordPress上增加中文用户时报错说不支持中文,失去如下谬误:谬误:请填写用户名。谬误:此用户名蕴含有效...

WordPress文章题目链接增加正在加载中提醒的办法

本文实例讲述了WordPress文章题目链接增加正在加载中提醒的办法。分享给大家供大家参考。详细剖析如下: 咱...

需求提交

客服服务