Ne v kontakte Antisocial programmer's blog

RoboMap Project: детальное исследование индексации поисковиками.

    projects     robomap

На разных SEO форумах неоднократно возникали обсуждения, касающиеся того, какие ссылки поисковики индексируют, а какие - нет. Тем не менее, однозначных выводов нигде так и не было сделано. Чтобы в деталях разобраться, какие поисковики и как индексируют ссылки я запустил небольшой проект под названием RoboMap. Ниже цитирую описание с его главной страницы:

Основная цель проекта RoboMap - это исследовать тонкости индексирования сайта поисковиками и влияние файла robots.txt на этот процесс.

В частности, будет выяснено, как поисковики обрабатывают инструкции Allow в robots.txt и разные типы ссылок. Для этого был создан набор страниц, на каждую из которых ссылается только один тип ссылок. Вот список разновидностей ссылок, которые будут исследоваться:

  • Текстовая ссылка
  • Простая JavaScript ссылка через window.open()
  • Простая JavaScript ссылка через document.location.href
  • JavaScript ссылка с url в контексте вызова: my_open_function('http://mysite.ru/page.html')
  • JavaScript ссылка с url вне контекста вызова: open_my_site()
  • JavaScript редирект, не ассоциированный с тегом <a>
  • HTTP Redirect.
  • Директива Allow в файле robots.txt

Read more →

Как зарегать красивый домен *.co.cc

Сегодня вообще довольно остро стоит "проблема" с бесплатными доменами - после введения RIPN'ом капчи при регистрации доменов .net.ru, .org.ru и .pp.ru вкупе с лимитом 4 домена в час простые смертные практически лишились возможности получить домен в этих зонах. Поэтому где-то вскоре после этого памятного события в моду стали входить домены на кокосовых островах - .co.cc. Сами поселиться там не можем, так хоть доменов нарегаем.

Фишка этой зоны в том, что стоимость домена определяется в зависимости от "красивости" домена. Поэтому домен www.google.co.cc там стоит 2,464 бакса, а www.sdgfsghfs.co.cc отдают на халяву. Некоторые даже заявляли, что зарегать что-нибудь толковое там нельзя в принципе и вообще все грустно... Все это действительно печально, но хотелось бы получить какой-нибудь домен и при том бесплатно. К счастью, при достаточной изобретательности это вполне реально, благо, любую автоматику легко обмануть.

Первый из них: если к какому-нибудь красивому слову добавить приставку "pro-" или "my-", то он почти наверняка будет бесплатным. Из свободных на данный момент - www.pro-film.co.cc, а пару дней назад я успешно зарегал www.pro-blog.co.cc.

Второй: Если между логическими частями интересующего нас домена добавить дефис, то он наверняка окажется бесплатным, или, в худшем случае, бдет стоить пару баксов, что, по сути, не деньги. В качестве примера - www.mp-3.co.cc.

Read more →

Кросспостинг

Почитав разные блоги других авторов, в частности, Ctrl+C, проникся мыслью о пользе кросспостинга и решил настроить его и для своего блога. По ходу дела вылезла проблема - мало какие сервисы умели импортировать записи из RSS, хотя и дружили с ЖЖ. Казалось бы - в чем проблема: настроить ЖЖ как надо и все дела. Но Drupal не умеет корсспостить в ЖЖ (для вордпресса есть такой плагин, а для Друпала нету :( ), а ЖЖ не умеет самостоятельно импортировать что бы то ни было откуда бы то ни было. Положение спас multiply.com, который умел и RSS импортировать и экспортировать в ЖЖ. К сожалению, в ЖЖ почему-то записи добавились в обратном порядке и во все сервисы, синхронизирующиеся с ЖЖ тоже. Надеюсь, хоть последующие посты нормально добавятся.

И так, вот список "зеркал" моего блога:

http://nevkontakte.multiply.com/journal http://ne-v-kontakte.livejournal.com/ http://live.cnews.ru/ne_v_kontakte/ http://nevkontakte.blog.ru/ http://nevkontakte.moskva.com/ http://livehh.ru/za2

Еще вроде как настроил импорт на ливинтернет, но старые записи он не скушал... Посмотрим, добавит ли новые. http://www.liveinternet.ru/community/2684512/

Read more →

Палю тему: Google Cache Browser

Речь пойдет о проекте Google Cache Browser Судя по всему, этот проект появился в сети совсем недавно, так как в поисковиках мне его обнаружить не удалось. Я сам узнал о нем совершенно случайно - друг за бутылочкой пива рассказал, что читал анонс этого сервиса на форуме какого-то хостинга, где девелопер обещал, что сайт вот-вот появится. Но это все лирика.

Что же на самом деле представляет собою этот сервис? Вот что говорится на странице описания проекта:

Google Cache Browser - это инструмент, позволяющий легко и быстро просматривать страницы из кеша Google. Принцип действия от части похож на веб-прокси (анонимайзер): Google Cache Browser (далее GCB) загружает страницу из кеша Google и заменяет ссылки в документе так, чтобы они приводили к загрузке новых страниц из кеша снова через GCB.

Иными словами, мы можем просматривать кеш гугля в режиме обычного серфинга. Удобно :)

Read more →

Избранное с блогов вебмастеров рунета в одном месте!

Дмитрий Рогов в своем блоге запустил один интересный проект. Идея проста до гениальности - собрать в одном месте ссылки на наиболее полезные статьи в блогах вебмастеров рунета.

Вот несколько ссылок, которые мне показались наиболее интересными с программистской точки зрения: Морфологический анализатор для PHP-скриптов Как избавиться от наказания за дублированный контент Проверка ТиЦ на PHP - ещё быстрее. и Определяем Google PR и Яндекс ТиЦ в PHP