Софт и сервисы для профессионального поиска. Поиск документов и данных в интернет Поиск файлов с помощью Рамблера

(Ю.А. ШАФРИН, газета «Информатика», № 9 2009)

1. Постановка задачи

Поиск информации в Интернете является крайне неопределенным понятием: в силу бесконечного разнообразия материалов Сети, - как по содержанию, как по форме представления, так и по структуре (как уже говорилось, мы встречаем в сети и линейные, и реляционные, и иерархические, и сетевые структуры данных).
Поэтому цели, методы и формы поиска информации (данных) могут быть самыми разными. Чтобы не занимать ваше внимание общими словами, приведем пару конкретных примеров.
1. Допустим, вы хотите найти в Интернете все материалы о конкретном человеке по его фамилии. Эту фамилию можно просто набрать как запрос в поле ввода какой-либо поисковой системы, - например, "Рамблер" (так произносят это название в компании). Результаты поиска целиком будут зависеть и от того, насколько эта фамилия распространена в обществе, и от популярности этой личности (именно популярности, а не масштаба!). Например, если набрать Фердыщенко, можно надеяться на успех либо вы что-то найдете, либо о таком человеке вообще ничего не слышали в Интернете. Другой пример: пусть искомая личность имеет фамилию Кулик. Если набрать ее в поле поиска, вы получите тысячи документов с Игорем, Андреем и т.д. Куликами, с Куликовыми, Куликовскими и т.п. Если, на ваше счастье, вашего Кулика зовут, допустим, Никифор (редкое имя), то запрос Никифор&Кулик резко повысит ваши шансы на успех. Поэтому формулируемый запрос должен определять как можно более узкую область поиска. С особой осторожностью следует относиться к омонимам. Например, вы хотите получить сведения о химическом элементе бор. Набирать это слово в иоле поиска бесполезно, так как бор - это сверло, хвойный лес, элемент, физик Бор. Если набрать запрос Элемент&бор, область поиска резко сузится.
2. Предположим, вас интересует какая-либо тематика (рубрика). В этом случае язык запросов и поиск по ключевым словам вам могут и не понадобиться. Если вы располагаете элементарным опытом, интуицией, то, начав с более или менее общей темы (например, "Наука и образование" на рис. 1 на с. 34) и пользуясь гиперссылками, сможете добраться до нужных вам документов (например, сначала "Рефераты", затем "Сборники рефератов, курсовых работ, дипломов" и т.д.). С известной долей уверенности можно утверждать, что в общем случае поиск в Интернете - это скорее искусство, опыт, кругозор и интуиция клиента, чем использование инструментальных средств обозревателя и поисковых систем. Следует четко различать разные механизмы поиска в Интернете, описанные в статье:

1) поиск документов по ключевым словам средствами универсальных поисковых систем;

2) специализированный поиск (например, людей);

3) поиск на текущей (отображаемой) странице.

Последний механизм, в свою очередь, делится на два типа - контекстный поиск фрагментов текста на странице и поиск в структурированных базах данных сайта, представленного этой страницей (товаров, вакансий, услуг, фирм и т.п.).

2. Общие сведения

"Всемирная паутина" в Интернете - это миллионы документов с неструктурированной текстовой информацией (а также с графикой, аудио, видео). Чтобы найти нужную информацию, клиенту Сети зачастую приходится перебирать сотни страниц web (иногда без особого успеха), тратить много сил и нервов (а также денежных средств).

С начала 90-х годов интенсивно развиваются справочные службы. Интернета, помогающие пользователям найти нужную информацию, и эти службы можно разделить на две категории: универсальные и специализированные.

В универсальных службах используется обычный принцип поиска в неструктурированных документах - по ключевым словам.

Ключевым словом документа называется отдельное слово или словосочетание, которое каким-то образом отражает содержание данного документа.

Например, для литературы по программированию характерны ключевые слова "Условный переход", "Макрокоманда", "Обработка прерываний" и т.д.

Универсальная служба поиска (поисковая система ) - это комплекс программ и мощных компьютеров, выполняющий следующие функции.

1. Специальная программа - поисковый робот - непрерывно просматривает страницы "Всемирной паутины", выбирает ключевые слова и составляет базу данных индексов . В эту базу включаются ключевые слова и адреса документов, в которых эти слова обнаружены. По ссылкам на другие документы робот "скачивает" и эти страницы, находит в них ссылки, и так далее, пока не обойдет весь интересующий его участок Сети. Когда робот-индексатор поисковой машины приходит на web-сайт (например, на www.rambler.ru ), он прежде всего проверяет, нет ли в корневом каталоге сайта служебного файла robots.txt (в нашем примере www.rambler. ru/robots.txt - имя робота записывается строчными буквами!). Если робот обнаруживает этот документ, все дальнейшие действия по индексированию сайта осуществляются в соответствии с указаниями robots.txt.

2. Web-сервер принимает от пользователя запрос на поиск, преобразует его и передает специальной программе - поисковой машине .

3. Поисковая машина просматривает базу данных индексов, составляет список страниц, удовлетворяющих условиям запроса (точнее, список ссылок на эти страницы), и возвращает его web-серверу.

4. Web-сервер оформляет результаты выполнения запроса в удобном для пользователя виде и передает их на машину клиента.

Специализированные справочные службы - это тематические каталоги (subject catalogs), в которых собраны более или менее структурированные сведения об адресах серверов по той или иной тематике. В отличие от универсальных баз индексов тематические каталоги составляются специалистами и обеспечивают клиента более строгой, достоверной и систематизированной информацией о документах Сети. Уровень "мусора" в этих каталогах гораздо ниже, чем в составленных автоматически индексах, но и обновляются они значительно медленнее. Ранее поисковые системы подразделяли на универсальные (с индексными базами данных) и "гибридные" (индексные базы и тематический поиск). Такая классификация в известной мере устарела: ныне большинство поисковых систем может считаться "гибридными" - они ведут поиск и в индексных базах данных, и по тематическим рубрикаторам. Вот небольшой список наиболее известных ныне поисковых систем с URL-адресами их начальных страниц:

MSN Web Search - http://search.msn.com (поисковая система службы MSN );

Excite - www.excite.com ;

Yahoo! - www.yahoo.com ;

Infoseek - www.infoseek.com ;

Lycos - www.lycos.com ;

Lycos - www.whowhere.lycos.com ;

Alta Vista - http://altavista.com ;

Google - www.google.ru ;

Rambler ("Рамблер") - www.rambler.ru ;

Aport ("Апорт") - http://aport.ru ;

Yandex ("Яндекс" или "Япс1ех") - www.yandex.ru .

Заметим, что среди российских пользователей наибольшей популярностью ныне пользуются русскоязычные системы Google, Yandex, Rambler и Aport. Практически на всех страницах, которые допускают поиск, имеется кнопка Помощь. Нажмите ее и распечатайте руководство по использованию системы.

3. Механизм встроенного поиска Microsoft

В общем случае, чтобы начать поиск, вы можете вызвать одну из поисковых систем или один из известных вам тематических каталогов. Однако разработчики Internet Explorer для удобства клиента чаще всего встраивают в очередную версию обозревателя своеобразный интерфейс с избранными на данный момент поисковыми системами. Сам Internet Explorer не занимается поиском: он принимает от пользователя запрос, обрабатывает его и передает соответствующей поисковой.

Нажмите на панели инструментов обозревателя кнопку Поиск .

На панели лоиска в поле ввода наберите запрос (логическое выражение) и нажмите кнопку Поиск (в разных системах - Искать, Найти!, Search ). Через некоторое время ниже поля ввода появляется список гиперссылок на документы, которые удовлетворяют введенному запросу. При наведении указателя мыши на гиперссылку, как правило, появляется подсказка (или краткое содержание этого документа, или просто его URL-адрес). Щелчком мыши вы можете открыть любой документ.

Ширину панели поиска можно изменить, перемещая мышью ее правую границу.

4. Общие механизмы поиска в Интернете

Итак, при поиске по ключевым словам (в индексных базах данных) вы набираете в поле ввода запрос, представляющий собой логическое выражение, которое формулируется по правилам синтаксиса данной поисковой системы.

Методы поиска нужных данных в безбрежном океане ресурсов Интернета можно разделить на три группы:

"интуитивно-эвристические" приемы, основанные на эрудиции, опыте, кругозоре и интуиции пользователя;

использование поисковых серверов , которые обеспечивают в известной мере формальные (инструментальные) механизмы поиска по ключевым словам ;

поиск в тематических (рубрицированных) каталогах .

1. Эвристика. Роль запроса в частном случае может играть одно-единственное слово (например, Аджика ). И это слово может сыграть роль отправной точки, начиная с которой вы не только выйдете на конкретную информацию , но и получите массу полезных данных об объектах , прямо или косвенно связанных с вашей задачей. Такая тактика обеспечивает весьма эффективный косвенный поиск, если "в лоб" трудно чего-либо добиться. Приведем несколько примеров.

1) Допустим, в качестве запроса вы набрали какую-либо редкую, но знаменитую фамилию, - например, Кторов (А.П. Кторов (1898-1980) - великий актер МХАТа). В этом случае вы наверняка получите не только информацию о Кторове, но и много интереснейших документов , имеющих прямое отношение к театру, к исполнительскому и драматическому искусству. Отправляясь от выданного реестра, вы можете, например, отыскать актеров с распространенной фамилией (например, Б.А. Смирнова) или библиографию редких книг о театре.

2) Наберите слово "Холодильник", и вы попадете во вполне обозримый круг данных, связанных с бытовой техникой: в интернет-магазины, торгующие не только холодильниками, но и другими бытовыми товарами, получите сведения об устройстве агрегатов, их потребительских свойствах, ценах, о фирмах-производителях и т.п.

3) Наберите "Аджика" (продукт питания), и вы сможете исследовать массу материалов с рецептами, узнать о книгах по кулинарному искусству и даже, возможно, о знаменитостях, увлеченных кулинарией.

4) Слово "Ависан" (лекарство) почти наверняка приведет вас к искомому препарату; попутно оно обеспечит вам возможность выйти на болезни, их симптомы, рекомендации по лечению. Вероятно, еще более ценным для вас окажется выход на многие очень полезные медицинские сайты, - например, на универсальный аптечный сайт Москвы http://apteka.mos.ru , где можно исследовать цены и заменители лекарства, подыскать другие медикаменты, о которых вы уже думали, но для поиска которых потребовались бы дополнительные усилия.

Как уже говорилось, при таком подходе эффективность поиска в Сети в значительной мере зависит от опыта и кругозора пользователя. Когда вы ищете материалы по определенной тематике, ни в коем случае не следует полагаться на "интеллект" машины: вы сами должны учитывать особенности лексикона специалистов по данной теме, возможные сочетания терминов и т.п.

2. Языки запросов. В основе запросов на поиск и выборку информации лежит аппарат алгебры логики . В качестве примера рассмотрим элементы языка запросов поисковой системы Yandex, применяемые для строгого поиска в индексных базах данных . По сути дела, это синтаксис логических выражений , и он мало отличается от синтаксиса других русскоязычных систем (например, Rambler и Aport). Для поиска документов, содержащих какое-либо слово, наберите его в поле поиска и нажмите кнопку Найти . Область поиска можно сузить: Новости, Товары, Энциклопедии (состав этих кнопок, как и вид домашней страницы , может меняться). Если запрос содержит несколько слов, необходимо соблюдать следующие правила:

1) логическое И (AND) - поиск сочетания в пределах предложения: натуральный шелк (разделитель - пробел) или натуральный&шелк;

2) логическое И (AND) - поиск сочетания в пределах документа: натуральный&&шелк;

3) поиск фразы - "Золотой Орфей" (прямые кавычки!).

Кроме того, можно искать по расстоянию между заданными терминами (заданному в словах или предложениях), искать в заголовке, в тексте ссылок, в описании, в подписях к изображениям; искать ссылки на заданный URL (например, #link="www.holm.ru*") и т.д. Yandex ищет не только по заданному слову, но и по его словоформам. Например, если вы задали слово "газета", то будут найдены документы, которые содержат слова "газеты", "газете", "газетой" и т.д.

3. Тематический поиск. Тематический рубрикатор системы Yandex позволяет многое найти и без помощи алгебры логики. Такие же рубрикаторы (но с иным содержанием) имеют и другие поисковые (и не только поисковые) системы, - например, Rambler и Aport.

5.Специализированный поиск

Технологии Интернета быстро развиваются. Систематически появляются новые инструменты поиска. Оригинальную (и, видимо, перспективную) систему специализированного поиска предлагает компания "Lycos": www.whowhere.lycos.com (в буквальном переводе "Кто? Где?").

Во-первых, вы можете по имени и фамилии человека искать адрес его электронной почты, номер его телефона, web-страницы, на которых упоминается этот человек (раскрывающийся список Search Type : (Тип поиска)). И наоборот, можно искать человека по его адресу E-mail или телефону.

Во-вторых, в основной части окна находится своеобразный рубрикатор, пользуясь которым можно искать людей того или иного круга, рода занятий и т.п.:

люди в сфере развлечений и любимых занятий: режиссеры, музыканты, спортсмены;

люди и деньги: инвесторы, брокеры, покупатели, должностные лица;

люди, "похожие на вас" (разделяющие ваши интересы, близкие вам по возрасту, мировосприятию, интеллекту и т.п.): женщины, дети, семьи, путешественники;

люди, которые могут помочь вам: консультанты по будущим занятиям, работодатели и т.

6. ICQ

В последнее время широкую популярность приобрела система общения между людьми под названием ICQ (произношение "I seek you" - я ищу тебя). Система работает с помощью специального программного обеспечения. Каждому адресату присваивается индивидуальный номер, который может быть занесен в записную книжку пользователя. Соединение устанавливается при выборе соответствующей записи из записной книжки.

7. Поиск данных на отображаемой странице

До сих пор мы, рассматривали поиск неструктурированных документов Web по ключевым словам в индексных базах данных, а также тематический поиск.
1. Вместе с тем обозреватель обеспечивает контекстный поиск на., всех отображаемых (текущих) страницах.
Для этого следует выбрать команду Слово целиком и С учетом регистра .
2. Многие сайты и порталы имеют собственные структурированные базы данных, в которых можно вести поиск какого-либо раздела БД (по тематике данного сайта). Например, на московском аптечном сайте http://apteka.mos.ru имеются два механизма такого поиска:
1) по алфавиту: вы щелкаете, скажем, на букве "П", и сайт выдает вам список всех лекарств на букву "П";
2) в стандартном поле поиска вы набираете название (например, Ависан ) и щелкаете на кнопке Найти (или Искать ). Система поиска сайта найдет вам все аптеки, в которых имеется набранный препарат, с указанием цен, адресов, телефонов и способов доставки. Механизмы поиска (а точнее, его детали) могут меняться на разных сайтах (в том числе и на одном и том же сайте), однако разобраться в них очень легко.
При поиске многих товаров, вакансий, услуг, фирм и т.п. (в иерархических структурах) область поиска можно постепенно (или сразу) сужать, указывая в нескольких полях ввода, например, модель потребительского изделия, желаемую цену, город, возраст и многое-многое другое.

Коротко о главном

1. Ресурсы Интернета содержат практически всю информацию, накопленную человечеством, и рубрикаторы этой информации можно найти на многих сайтах и во всех поисковых системах (например, электронные библиотеки, отдельные статьи, музеи, театры и т.д. и т.п.).
2. Для поиска в Интернете можно использовать специальные поисковые системы, которые располагают строгими языками запросов на основе алгебры логики. Кроме того, эти системы и многие сайты, которые нельзя считать поисковыми, дают возможность вести тематический и специализированный поиск. Сейчас в Рунете наиболее популярны системы Google, Yandex, Rambler, Aport и другие.
3. Internet Explorer чаще всего имеет встроенный механизм поиска, позволяющий в удобной форме пользоваться услугами поисковых систем.
4. Существуют различные системы специализированного поиска (например, людей в сфере развлечений и любимых занятий: режиссеров, музыкантов, спортсменов).
5. Обозреватель обеспечивает возможность контекстного поиска на всех отображаемых (текущих) страницах. Для этого следует выбрать команду [Правка-Найти на этой странице...] и в появившемся окне набрать искомый текстовый фрагмент. Допускается установка флажков Слово целиком и С учетом регистра . Многие сайты имеют встроенные механизмы поиска по тематике данного сайта (товаров по алфавиту, вакансий и т.п.).

Секреты поиска. Как найти нужный документ.

Всем привет, это следующий урок о том, как правильно искать информацию в сети с помощью Google. Есть одна хитрость, которая, впрочем как всегда, никаким секретом не является. Мало кто из нас задумывается, но логически это понимают все – интернет это далеко не только веб-страницы ресурсов. Это видео, фото и аудио файлы, это документы различных форматов и многое другое. Даже не всегда на том или ином ресурсе в силу каких-то обстоятельств (в том числе и по недосмотру владельца файла) мы имеем доступ к нему по прямой ссылке для скачивания. Но в сети они есть и Google их прекрасно видит. Файлы проиндексированы поисковой системой, а значит, они доступны и для нас. Так что найти нужный документ бывает проще, чем каждый из нас думает. Давайте найдём их.

Перед тем, как перейти конкретно к поиску, стоит упомянуть о специальном сервисе Google, о котором, оказывается, мало кто знает. Это страница расширенного поиска:

https://www.google.com/advanced_search?hl=ru

Я нарочно оставлю это без комментариев, там всё по-русски. Изучайте и пользуйтесь. Это, скажем, страница продвинутого поиска без знания .

У каждого из файлов есть своё расширение, которое определяет тип программы, с помощью которой ему положено открываться. По умолчанию тип сокрыт от глаз пользователя. Но не для Google. Даже не зная названия документа полностью, вы сможете (теоретически) попытаться найти нужный документ, зная, что он имеет вид, например, документа Word из набора Microsoft Office. Вобщем, Google понимает вот такие расширения:

Adobe Portable Document Format (PDF) Adobe PostScript (PS) MacWrite (MW) Microsoft Excel (XLS) Microsoft PowerPoint (PPT) Microsoft Word (DOC) Microsoft Works (WDB, WKS, WPS) Microsoft Write (WRI) Rich Text Format (RTF) Text (ANS, TXT)

И некоторые другие, более специфичные. Если вы собираетесь найти нужный документ, например, обязательно в формате Word с расширением.docx, то можно попробовать задать этот параметр (без точки перед расширением) уже в поисковой строке. Это должно выглядеть так:

Название_документа\файла\фильма\песни filetype:тип_файла

Например:

Договор купли-продажи кактуса filetype:docx

По аналогии с известным вам исключением ненужной информации из поисковой выдачи, можно, наоборот, исключить из неё ненужные расширения и работать только с определёнными их типами. Используем, тем самым, оператор исключения «-». Например:

Договор купли-продажи кактуса -filetype:docx

Всё. В поисковой выдаче страниц с договором в формате Word не будет. Будут PDF, TXT, но не Word.

Как найти нужный документ на конкретном сайте или домене.

Нередко перед некоторыми пользователями ставится задача найти нужный документ или просто посмотреть некоторую информацию только на ресурсах, имеющих более высокую степень доверия по сравнению с остальными. Например, домены.com, .edu, .org принадлежат правительственным или образовательным учреждениям, которые имеют больший информационный вес. Или нам необходимо узнать информацию или новость из первоисточника. А про обрушение котировок на английской бирже лучше узнать не из израильского сайта, не так ли? Потому лучше было зондировать именно английские источники информации – это доменная зона британцев.uk. Или канадцев – .ca. Или французов – fr. И так далее.

Так вот, чтобы заняться поиском только по конкретной доменной зоне, укажите тип домена в поисковом запросе с помощью оператора “site:”. Например:

Site:.edu (не забудьте точку перед названием домена)

И при наборе информации в определённой зоне:

Do it yourself.:ru

Google будет искать результаты только в русскоязычном интернете (рунете).

По аналогии с доменной зоной можно сократить место поиска до конкретного веб-сайта. Например, если нужно прочитать справку о том или ином событий в операционной системе Windows, есть смысл обратиться к первоисточнику. Ищите в пределах только официальной справки от Microsoft на официальном сайте. Для этого используйте тот же самый оператор в таком виде:

Ошибка 000240767 site:www.microsoft.com (точку перед адресом ставить нельзя!)

Все найденные результаты будут касаться только этого сайта.

Значительно сократить время поиска документов и файлов вплоть до нескольких минут и даже секунд помогут некоторые полезные сервисы:

Расширенный поиск Яндекса. Далеко не все в курсе, что у поисковых машин существует расширенные версии поиска. У Яндекса этот сервис располагается на этой странице: http://yandex.ru/search/advanced. Здесь, введя требуемый запрос, вы можете уточнить детали этого запроса. Например, язык документа, дату публикации, ну и, конечно же, необходимый вам формат. После нажатия на кнопку «Найти», поисковик выдаст вам список ссылок на документы требуемого формата. Вам остается только нажать на кнопку «Загрузить», и произойдет скачивание документа непосредственно с сервера, на котором документ или файл находится без всяких регистраций. Или можно вначале почитать содержимое документа без закачки, нажав на кнопку «Просмотреть», чтобы не перегружать компьютер ненужными файлами.
Расширенный поиск Google. Google также предоставляет возможность найти файлы нужного формата. Вот страница, где это можно сделать: http://www.google.ru/advanced_search. В отличие от Яндекса, Google дает возможность осуществлять поиск по таким экзотическим форматам, как: Adobe PostScript (.ps), Autodesk DWF (.dwf), Shockwave Flash (.swf). На самом деле список форматов, по которым Google осуществляет поиск, намного шире. Если вы в конце поисковой фразы добавите так называемый оператор запроса filetype: и добавите за ним необходимый вам формат файла, то вы сможете без труда найти искомый файл. Например, если вам нужно найти MIDI-файл композитора Баха, то вы можете набрать Bach filetype:mid и вполне вероятно, что вы отыщете то, что вам было нужно.
Еще один полезный сервис находится по этому адресу: http://wte.su/poisk.html. Это сервис поиска по документам различных форматов, в том числе и TXT, FB2, ODT, и даже RAR и ZIP. После ввода вашего запроса, вы можете быстро перемещаться по вкладкам, осуществляя поиск по конкретному типу файла. У сервиса 2 существенных преимущества - простота и скорость поиска. Единственный недочет - ссылки не всегда ведут на конечный файл. Там, где есть прямая ссылка на файл, вы увидите кнопку «Скачать».
Также для поиска файлов можно воспользоваться сервисом поиска по FTP-серверам http://filemare.com/. Ведь иногда файлы выгружают на FTP-серверы с открытым доступом к внутренним папкам, а вот поисковые машины часто их не находят. После того как вы введете ваш запрос в строку поиска данного сервиса, вы увидите список найденных в интернете файлов и папок, которые содержат в своем имени или в пути к себе текст, введенный вами в поисковом запросе.

Иногда случается так, что вы хотите скачать свободно распространяемый музыкальный альбом 2007 года, выпущенный исполнителем, которого знает три с половиной человека. Вы находите торрент-файл, запускаете его, загрузка доходит до 14,7% и… всё. Проходят дни и недели, а загрузка стоит на месте. Вы начинаете искать альбом в Google, рыщете по форумам и наконец находите ссылки на какие-нибудь файлообменники, но они уже давно не работают.

Такое происходит всё чаще и чаще - правообладатели постоянно закрывают полезные ресурсы. И если популярный контент найти по-прежнему не проблема, отыскать какой-нибудь телевизионный сериал семилетней давности на испанском языке может быть крайне трудно.

Что бы вам ни понадобилось в интернете, есть ряд способов это отыскать. Мы предлагаем все нижеперечисленные варианты исключительно для ознакомления с контентом, но ни в коем случае не для воровства.

Usenet

Usenet - распределённая сеть серверов, между которыми синхронизируются данные. Структура Usenet напоминает гибрид форума и электронной почты. Пользователи могут подключаться к специальным группам (Newsgroups), что-то в них читать или писать. Как и в случае с почтой, у сообщений есть тема, которая помогает определить тему группы. Сегодня Usenet используется по большей части для обмена файлами.

До 2008 года крупные провайдеры Usenet хранили файлы лишь 100–150 дней, однако затем файлы стали храниться вечно. Более мелкие провайдеры оставляют контент на 1 000 и более дней, чего зачастую тоже достаточно.

Примерно в середине 2001 года Usenet стали замечать правообладатели, из-за чего провайдерам пришлось удалять защищённый авторским правом контент. Но энтузиасты быстро нашли обходной путь: они стали давать файлам запутанные названия, защищать архивы паролями и добавлять их на специальные сайты, к которым можно получить доступ только по приглашению.

В России о существовании Usenet почти никто не знает, чего не скажешь о странах, где власти усердно борются с пиратством. В отличие от протокола BitTorrent, в Usenet нельзя определить IP-адрес пользователя без помощи провайдера сервиса или поставщика интернет-услуг.

Как подключиться к Usenet

В большинстве случаев бесплатно подключиться не выйдет. Придётся довольствоваться либо малым временем хранения файлов, либо низкой скоростью, либо доступом только к текстовым группам.

Провайдеры предлагают два типа платного доступа: ежемесячную подписку с неограниченным объёмом загружаемых данных или неограниченные по времени тарифы с лимитированным трафиком. Второй вариант - для тех, кому лишь иногда требуется что-то скачать. Крупнейшие поставщики таких услуг - Altopia , Giganews , Eweka , NewsHosting , Astraweb .

Теперь нужно понять, где брать NZB-файлы с метаинформацией - что-то вроде торрент-файлов. Для этого используются специальные поисковые движки - индексаторы.

Индексаторы

Публичные индексаторы полны спама и , но они всё ещё годятся для поиска файлов, загруженных пять или более лет назад. Вот некоторые из них:

Бесплатные индексаторы, требующие регистрации, больше подходят для поиска новых файлов. Они хорошо структурированы, у контента есть не только названия, но и описания с картинками. Можно попробовать следующие:

Также существуют индексаторы только для определённых типов контента. Например, anizb подойдёт поклонникам аниме, а albumsindex - тем, кто ищет музыку.

Скачивание из Usenet

В качестве примера возьмём «Фрейзер Парк» (The FP) - малоизвестный фильм 2011 года, вариант которого в разрешении 1080p отыскать практически невозможно. Нужно найти NZB-файл и запустить его через программу вроде NZBGet или SABnzbd .

Как качать через IRC

Вам потребуется IRC-клиент. Подойдёт почти любой - подавляющее большинство поддерживает DCC. Подключитесь к интересующему вас серверу и начинайте качать.

Крупнейшие серверы с книгами:

irc.undernet.org, комната #bookz;
irc.irchighway.net, комната #ebooks.

Фильмы:

irc.abjects.net, комната #moviegods;
irc.abjects.net, комната #beast-xdcc.

Западная и японская анимация:

irc.rizon.net, комната #news;
irc.xertion.org, комната #cartoon-world.

Для поиска файлов можно использовать команды!find или @find. Бот отправит результаты в виде личного сообщения. Если возможно, отдавайте предпочтение команде @search - она запускает специального бота, который предоставляет результаты поиска в виде одного файла, а не огромного потока текста.

Попробуем скачать «Как музыка стала свободной» (How Music Got Free) - книгу о музыкальной индустрии, написанную Стивеном Уиттом (Stephen Witt).

medium.com

Бот отреагировал на запрос @search и отправил результаты в виде ZIP-файла по DCC.

medium.com

Отправляем запрос на скачивание.

medium.com

И принимаем файл.

medium.com

Если вы нашли файл с помощью индексатора, то вам не нужно искать его на канале. Просто отправьте боту запрос на загрузку, используя команду с сайта индексатора.

DC++

В DC-сети все коммуникации осуществляются через сервер, называемый хабом. В ней можно искать конкретные типы файлов: аудио, видео, архивы, документы, образы дисков.

Делиться файлами в DC++ очень просто: достаточно поставить галочку напротив папки, к которой вы хотите предоставить общий доступ. За счёт этого можно отыскать что-то совершенно невообразимое - что-то, о чём вы сами уже давно забыли, но что может кому-то внезапно пригодиться.

Как качать через DC++

Подойдёт любой клиент. Для Windows лучшим вариантом является FlylinkDC++ . Пользователи Linux могут выбирать между и AirDC++ Web .

Поиск и загрузка реализованы удобно: введите запрос, выберите тип контента, нажмите «Искать» и два раза щёлкните по результату, чтобы скачать файл. Также можно просмотреть список всех открытых пользователем файлов и загрузить все файлы из выбранной папки. Для этого нужно правой кнопкой мыши щёлкнуть по поисковому результату и выбрать соответствующий пункт.

medium.com

Если что-то не нашли, попробуйте позже. Зачастую люди включают DC-клиент только когда им самим нужно что-то загрузить.

Индексаторы

Встроенный поиск находит только файлы в списках пользователей, находящихся в онлайн-режиме. Чтобы отыскать редкий контент, вам понадобится индексатор.

Единственный известный вариант - spacelib.dlinkddns.com , а также его зеркало dcpoisk.no-ip.org . Результаты представлены в виде magnet-ссылок, при нажатии на которые файлы сразу начинают скачиваться через DC-клиент. Стоит учитывать, что порой индексатор долгое время недоступен - иногда до двух месяцев.

eDonkey2000 (ed2k), Kad

Как и DC++, ed2k - протокол децентрализованной передачи данных с централизованным хабом для поиска и соединения пользователей друг с другом. В eDonkey2000 можно найти почти то же самое, что и в DC++: старые сериалы с разной озвучкой, музыку, программы, игры, старые , а также книги по математике и биологии. Впрочем, есть здесь и новые релизы.