Сервисы и трюки, с которыми найдётся ВСЁ.
Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход.
Всё, что попадает в интернет, сохраняется там навсегда. Если какая-то информация размещена в интернете хотя бы пару дней, велика вероятность, что она перешла в собственность коллективного разума. И вы сможете до неё достучаться.
Поговорим о простых и общедоступных способах найти сайты и страницы, которые по каким-то причинам были удалены.
Кэш Яндекса, почему бы и нет
К сожалению, нет способа добрать до кэша Яндекса по прямой ссылке. Поэтому приходиться набирать адрес страницы в поисковой строке и из контекстного меню ссылки на результат выбирать пункт Сохраненная копия. Если результат поиска в кэше Google вас не устроил, то этот вариант обязательно стоит попробовать, так как версии страниц в кэше Яндекса могут отличаться.
Google Cache Browser
У всех перечисленных способов, как посмотреть кеш в Google, есть один существенный недостаток. С их помощью можно увидеть только одну страницу сайта, после чего придется скопировать ссылку на нужный раздел и проделать всю процедуру заново. Чтобы ускорить этот процесс и получить возможность «бродить» по всему сайту, предлагаем воспользоваться сервисом https://cache.nevkontakte.com/#! и изучить все сохраненные данные в один клик.
Чтобы воспользоваться сервисом, достаточно перейти по ссылке и на главной странице ввести адрес сайта, к которому нужен доступ. Система автоматически находит сохраненную информацию и предоставляет пользователю.
Кэш Baidu, пробуем азиатское
Когда ищешь в кэше Google статьи удаленные с habrahabr.ru, то часто бывает, что в сохраненную копию попадает версия с надписью «Доступ к публикации закрыт». Ведь Google ходит на этот сайт очень часто! А китайский поисковик Baidu значительно реже (раз в несколько дней), и в его кэше может быть сохранена другая версия.
Иногда срабатывает, иногда нет. P.S.: ссылка на кэш находится сразу справа от основной ссылки.
Что такое кеш сайта и зачем он нужен
Поисковая система Google оснащена так называемыми ботами, которые регулярно посещают страницы сайтов и сохраняют их в памяти поисковика. Это и есть кеш, в котором сохраненная копия сайта остается даже в том случае, если сам ресурс был удален. Следует отметить, что боты «гуляют» по Интернету достаточно активно, поэтому информация в кеше, как правило, является актуальной. Однако есть два важных нюанса:
- Чем чаще на сайте появляются новые публикации, тем чаще его посещает бот, а значит, данные будут максимально свежими.
- Нередко случается так, что после удаления статьи с сайта по этой ссылке пользователь видит сообщение об ошибке. Однако бот успел посетить эту пустую страницу и сохранил ее в кеш, удалив прошлую актуальную версию.
Разобравшись с особенностями работы кеша Google, стоит понять, для чего поисковая система хранит в памяти старые версии сайтов. Эксперты приводят несколько серьезных аргументов:
- Страница с материалами была удалена с сайта, а вам срочно нужны именно эти данные.
- Часть информации в нужной публикации была изменена на другие материалы.
- Владелец сайта удалил его или закрыл доступ для пользователей.
- Сайт слишком перегружен, в результате чего страницы загружаются долго.
- На сайт обрушилась ддос-атака, поэтому данные оказались временно заблокированы.
- Программисты проводят технические работы, в результате чего открыть нужную страницу невозможно.
Очевидно, что главная причина поиска сохраненных страниц заключается в утерянной информации и попытке восстановить ее с помощью функционала Google. И если с причинами и особенностями кеширования все понятно, можно переходить к главному вопросу: как посмотреть старую версию сайта и сохранить нужные сведения.
Кэш браузера, когда ничего не помогает
Страницу целиком таким образом не посмотришь, но картинки и скрипты с некоторых сайтов определенное время хранятся на вашем компьютере. Их можно использовать для поиска информации. К примеру, по картинке из инструкции можно найти аналогичную на другом сайте. Кратко о подходе к просмотру файлов кэша в разных браузерах:
Safari
Ищем файлы в папке ~/Library/Caches/Safari.
Google Chrome
В адресной строке набираем chrome://cache
Opera
В адресной строке набираем opera://cache
Mozilla Firefox
Набираем в адресной строке about:cache и находим на ней путь к каталогу с файлами кеша.
Выходим за рамки Google
Понятно, что сохранением страниц и сайтов в кеше занимается не только поисковая система Google. У пользователей есть еще несколько вариантов, как можно найти удаленную статью или другие данные с сайта:
- Кеш Яндекса. Система работает по такому же принципу, однако сохраненные версии могут отличаться от тех, которые хранит Google. Чтобы открыть кеш Яндекса, необходимо ввести в поиске адрес сайта и перейти к сохраненной копии с помощью зеленой стрелочки (точно так же, как и при работе с Google).
- Специализированный поисковик CachedView.com, который не ограничивается Google, а предлагает пользователям доступ к Всемирному архиву Интернета. Работает по принципу Nevkontakte.com.
- Еще один интересный сервис, на который стоит обратить внимание, находится по адресу archive.is. Его главная функция заключается в том, чтобы пользователь мог самостоятельно сохранять нужные страницы сайта. При этом сервис не требует регистрации и является бесплатным. Дополнительное преимущество архива – возможность искать данные среди страниц, которые сохранили другие пользователи.
Таким образом, даже удаленные из Интернета материалы можно найти и восстановить. Какой способ для этого выбрать? Рекомендуем не останавливаться на одном методе, а попробовать несколько, чтобы наверняка найти нужную страницу или сайт.
Расширения для браузеров
Существуют расширения для браузеров на все случаи жизни, в том числе и для доступа к кэшированной версии сайта.
Добавьте в Chrome расширение Web Cache Viewer и нажмите правой кнопкой мыши на любой странице для просмотра версии из Google или Wayback Machine. Расширение под названием View Page Archive & Cache для Chrome или Firefox идёт ещё дальше и позволяет смотреть кэшированные версии веб-страниц из многочисленных поисковых движков, таких как Bing, Baidu, Yandex.
Для чего нужна сохраненная копия страницы в Яндексе
Прежде всего, отметим, что сохраненная копия в поисковой системе Яндекс — это важный инструмент SEO оптимизатора. С ее помощью можно увидеть, какая версия документа уже проиндексирована роботами поисковой системы и участвует в ранжировании, а какие страницы еще не прошли данный процесс. Таким образом, наличие сохраненной страницы в Яндексе — индикатор успешно пройденной индексации.
- В ходе работы с интернет-ресурсами могут возникнуть самые различные ситуации. В частности на сайтах периодически осуществляются технические работы: внесение корректировок в дизайн/изменение шаблона /редактирование или удаление текстовых материалов. В ходе данных работ легко можно допустить ошибку, которая ведет к негативным последствиям: исчезновение дизайна/текста/другого элемента, изменение шаблона не по плану и так далее. Наверняка, каждый разработчик сайтов имел такой печальный опыт. Если есть возможность бэкапа или подключен качественный хостинг, через который можно вернуть все как было — прекрасно. Но начинающие ресурсы, как правило, не имеют такой возможности. В этом случае поможет сохраненная копия страницы в Яндекс. С ее помощью можно увидеть, как все было на момент индексации роботами и восстановить вид страницы, исправить ошибки. Но учтите, что хранение страницы в индексе не вечно, и если на нее робот зашел в период, когда она уже была в нерабочем состоянии, вы вполне можете не увидеть старой информации.
- Еще одна ситуация, когда полезна будет сохраненная копия страницы в Яндексе: в ходе работы над сайтом вы изменили текстовый материал, с целью увеличения релевантности страниц. Теперь вам нужно посмотреть, выполнено ли обновление страницы, где вы внесли изменения. Сделать это можно просмотрев сохраненную копию.
- Нередко сайты бывают недоступны, причин для этого может быть много: технические неполадки, истек срок хостинга и так далее. Чтобы в этой ситуации зайти на сайт, нужно найти сохраненную копию и просмотреть ее. Таким образом, польза сохраненных страниц Яндекса очевидна.
Как посмотреть сохраненную копию страницы в Яндексе
Все современные поисковые системы, и Яндекс не исключение, позволяют пользователям открыть нужные веб-документы через их индекс. Это можно сделать быстро с помощью специальных сервисов или вручную. В первом случае на помощь придут сервисы: Page Promoter в Firefox, RDS bar для Хроме и другие. Однако плагины периодически могут некорректно работать и выходить из строя, поэтому владеть ручным методом тоже нужно.
Первый способ
Открываем поисковик Яндекс и в строке поиска прописываем сам адрес нужной страницы или интересующий запрос. В результатах поиска мы видим, что в сниппете каждого результата есть маленькая стрелочка. Нажимаем на стрелочку и выбираем «Сохраненная копия». После этого мы посетим сайт, его сохраненную страницу от какой-то прошедшей даты.
Второй способ
Способ заключается в применении специальных расширений браузера/плагинов/онлайн сервисов. Наиболее популярным сегодня является «RDS bar». Интерфейс плагина более чем простой, с его помощью можно просмотреть последние изменения страницы, когда страницу в последний раз посещал робот, следовательно и копия предоставляется за это число. Если нужная страница не прошла индексацию Яндекса, ее сохраненная копия не будет отображаться в результатах выдачи поисковика.
Почему страницы может не быть?
Иногда во время поиска при нажатии на стрелочку сниппета нужного пункта может и не быть. Это происходит по ряду причин:
- Сбой в работе поисковика. В Яндексе даже не скрывают, что нет никаких гарантий на наличие и показ копий — система может просто не сохранять страницы по какой-либо причине.
- Второй вариант: html-кодировка документа содержит мета-тег «robots» со значением «noarchive», что означает запрет на кэширование. Чтобы не рисковать из-за этого трафиком, стоит внимательно настроить соответствующие блоки и очистить ненужные значения.
Нет копии: чем это грозит?
С точки зрения продвижения — опасность нулевая. А вот сами причины, из-за которых невозможно сохранение, могут быть вредны, нужно разбираться именно в них.
Эксперты уверены, что проблема с копиями может обернуться трудностями при работе с биржами ссылок. Так, на некоторых известных биржах строго контролируют, есть ли в Яндексе копия, проверяя параметр No Index Cache (NIC).
Wayback Machine
Существуют организации, которые пытаются сохранить историю интернета. Самой известной такой организацией является некоммерческая Internet Archive, где хранятся веб-сайты, текст, видео, аудиозаписи, программное обеспечение и изображения, которые трудно найти где-то ещё. Старые версии веб-сайта вы можете посмотреть также на Wayback Machine.
Введите URL-адрес и движок архивного поиска покажет календарь, где отображается, когда Wayback Machine сохранила эту страницу. Нажмите на дату в календаре для просмотра того, как сайт выглядел в этот день. Wayback Machine и является отличным способом изучения истории интернета.
Как удалить сайт из кэша
Чтобы ускорить индексирование страницы поисковиками, владельцы ресурсов удаляют из кэша старые версии. Так, Яндекс и Google не обходят стороной ссылки, которые уже прописаны у них системе. Обе системы проводят периодическую актуализация данных, но этим занимается робот. Из-за такой специфики обновление информации происходит дольше, чем при вмешательстве владельца сайта.
Чтобы удалить страницу из кэша Google, необходимо:
- Зайти в сервис Webmaster.
- Перейти в раздел меню “Удалить URL-адрес”.
- Нажать на кнопку “Временно скрыть”, чтобы страницы перестала отображаться в результатах поиска.
- Ввести адрес ссылки.
- Нажать кнопку “Продолжить”.
- Выбрать необходимый тип удаления, в данном случае — второй пункт.
- Подтвердить запрос.
- Дождаться, когда заявка перейдет из статуса “Ожидание” в “Выполнено”.
Внимание!
Поисковая система Яндекс также поддерживает очистку кэша страниц, но для этого придется полностью удалить ссылку из каталога. При этом сбрасываются вся статистика и индексы.
Заблокированный сайт — еще не приговор. Сервисы Яндекс и Гугл постоянно создают кэш всех ресурсов, поэтому пользователи смогут получить к ним доступ даже после удаления контента с серверов. Для этого не потребуется дополнительный софт. Открыть копию можно всего в 2 клика. При этом она будет соответствовать последней актуальной версии сайта. Страницы из кэша могут спасти веб-программистов, если изменения кода обрушили весь интерфейс, а вспомнить, как он должен выглядеть, не получается.
Как найти архивные копии сайтов интернета или машина времени для сайтов
Существует настоящая, реальная машина времени, в которой можно ненадолго вернуться в прошлое и увидеть, например, как выглядел тот или иной сайт несколько лет назад. Думаете, никому не нужны копии сайтов многолетней давности? Ошибаетесь! Для очень многих людей сервис по архивированию информации весьма полезен.
Во-первых, это просто интересно! Из чистого любопытства и от избытка свободного времени можно посмотреть, как выглядел любимый, популярный ресурс на заре его рождения.
Во-вторых, далеко не все владельцы сайтов ведут свои архивы. Знать место, где можно найти информацию, которая была на сайте в какой-то момент, а потом пропала, не просто полезно, а очень важно.
В-третьих, само по себе сравнение является важнейшим методом анализа, который позволяет оценить ход и результаты нашей деятельности. Кстати, при проведении анализа веб-ресурса очень эффективно использовать ряд методов сравнения.
Поэтому наличие уникальнейшего архива веб-страниц интернета позволяет нам получить доступ к огромному количеству аудио-, видео- и текстовых материалов. По утверждению разработчиков, «интернет-архив» хранит больше материалов, чем любая библиотека мира. Мы попали в правильное место!
Что нужно, чтобы найти копии сайтов интернета
Для того, чтобы отправиться в прошлое, нужно перейти на сайт archive.org и воспользоваться поисковой строкой.
Простой поиск в архиве сохраненных сайтов выдает нам ссылки на все сохраненные копии запрашиваемой страницы.
Из этого скриншота видно, что сайт kopilkasovetov.com был создан в 2012 году (Кстати, важно отметить, с помощью практически идеального хостинга Спринтхост — рекомендую!). Переключаясь на нужный нам год, можно увидеть даты, выделенные кружочками, это и есть даты сохранения копии сайта. Например, в 2015 году, пока можно будет увидеть только одну копию от 7 февраля.
Archive.Today
Сайт архивирования Archive.Today позволяет пользователям сохранять текущие веб-страницы и искать ранее сохранённые. Введите URL-адрес для сохранения или для просмотра сохранённых страниц, которые также можно скачивать на компьютер.
Если вы хотите посмотреть архивные версии веб-сайта, введите его адрес в поисковую панель и появятся результаты с домашней страницей и связанными отдельными страницами. Если есть больше одной версии одной страницы, они будут показываться все вместе для упрощения просмотра.