Библиотека журналиста... Все, что вы хотели знать о журналистике...
СМИ вообще | пресса | радио | телевидение | интернет

СМИ вообще

01 ноября 2004 года

Глава 4.
Максимально использовать возможности баз данных

Книга "Журналистские расследования: современные методы и техника"

Несмотря на то, что многие журналисты пользуются благами электронных библиотек, большинство библиотекарей обращаются лишь к ничтожной доле имеющихся 5 000 электронных баз данных. В этой главе говорится о том, как лучше использовать доступные вам базы данных, а в подверстке - как расширить круг электронных источников информации в вашей работе.

Вам уже известно, что электронные базы данных - великолепное средство получения вспомогательной информации практически на любую тему. Поиск информации в базах данных стал обычным делом в журналистских расследованиях, да и в повседневной работе печатных изданий и вещательных станций.

Возможно, и вы привычно пользуетесь этим источником информации. Не исключено, что вы часто общаетесь с редакционным библиотекарем, который помогает вам в поиске материала. Но знаете ли вы, какие информационные возможности хранят в себе электронные базы данных, если поиск ведет мастер своего дела?

В качестве примера приведем случай из практики газеты "Филадельфия инквайрер", когда электронная информация помогла Дону Барлетту и Джеймсу Стилу в подготовке серии статей, увенчавшей их второй Пулитцеровской премией. Темой этих статей были налоговые поблажки, которые конгресс предоставлял отдельным лицам и корпорациям. Конкретные факты выявлялись с большим трудом, поскольку в общественно-доступных документах часто отсутствовали имена облагодетельственных лиц и названия компаний. Вот что рассказывает сам Барлетт:

"Из законопроекта о налогах можно было извлечь информацию о предоставленных льготах только в таком виде:

Корпорация, зарегистрированная в штате Делавер 10 августа 1928 года, долговые обязательства которой на 28 мая 1986 года составляли:

  • 975 млн долларов - банковский кредит со сроком погашения 31 мая 1994 года;
  • долговые обязательства под 12,5% годовых на общую сумму 400 млн долларов со сроком погашения 1 июня 2001 года;
  • долговые обязательства под 12,5% годовых на общую сумму 225 млн долларов со сроком погашения 1 июня 1998 года.

Я позвонил нашему библиотекарю Дженнифер Юинг, молодой женщине, с которой мы уже несколько лет сотрудничали. Произошел примерно такой разговор:

Барлетт: Нам нужны сведения об одной компании.

Юинг: Название, пожалуйста.

Барлетт: Мы не знаем.

Последовала продолжительная пауза, во время которой Дженнифер, привыкшая к самым невероятным просьбам с нашей стороны, тщательно подбирала слова, понося про себя наших предков. Наконец, она отреагировала.

Юинг: Может быть, хоть намекнете, что за компания.

Барлетт: У нас есть пара-другая цифр.

Я дал ей сумму и сроки погашения задолженности. Через 5 минут раздался ответный звонок, и Дженнифер сообщила нам, что название интересующей нас компании "FMC Corp".

В базе данных службы финансовых новостей Доу Джонс, она отыскала статью из "Уолл-Стрит Джорнал" о задолженности "FMC Corp.", сумма и сроки погашения которой совпадали с нашими цифрами. Дополнительная проверка по справочнику компаний "Standard & Poor" показала, что "FMC Corp." зарегистрирована в штате Делавер 10 августа 1928 года".

Для нас, простых смертных, этот рассказ звучит как захватывающая детективная история. А для Дженнифер Юинг, которая, сидя за компьютером, разыскивает информацию для "Филадельфия инквайрер", это была не такая уж сложная задача. Самое трудное дело - вычислить из множества доступных ей баз данных ту самую, где наиболее вероятно присутствуют нужные сведения. Приведенный случай в какой-то мере иллюстрирует достоинства и недостатки поиска информации в базах данных.

Достоинства

Для журналиста - для любого журналиста, независимо от места работы - электронные базы данных по-прежнему представляют величайший, самый оперативный источник новейшей информации. К тому же это еще и экономичный источник информации. Поиск в базах данных перестал быть привилегией преуспевающих газет, хотя широкое распространение этой технологии в СМИ еще впереди. С каждым годом сотнями прирастают общедоступные базы данных.

Согласно периодическому справочнику "Cuadra Directory of Databases", издаваемому исследовательской корпорацией "Gale", в 1979-1980 годах насчитывалось 400 баз данных, созданных 221 организацией. В выпуске от 1 июля 1991 года "Cuadra" перечисляет уже 5 026 баз данных, созданных 2 158 организациями.

Информация, содержащаяся в базах данных, избавляет нас от необходимости заново изобретать велосипед и напоминает журналистам, что велосипед уже изобретен и многие на нем катаются в свое удовольствие.

Недостатки

Почти для всех журналистов поиск информации в электронных базах данных остается двухступенчатым процессом, отдаляющим журналиста от самостоятельного поиска.

У журналиста появляется идея статьи. Библиотекарь переводит эту идею в параметры поиска, отбирает базу (или базы) данных, осуществляет поиск и передает результаты журналисту, который смотрит, соответствуют ли они запросу.

До недавнего времени я думал, что так оно и должно быть. Ведь если информацию помещают в базу данных библиотекари, то кто кроме них сможет лучше извлечь ее?

Я, например, прослушал курс поиска информации, готовясь к защите диссертации в Миссурийском университете, участвовал в семинарах по поиску информации, проводимых поставщиками компьютерной техники, писал на эту тему и время от времени сам занимался поиском на протяжении более 10 лет. По десятибалльной шкале я оцениваю свои способности к поиску на 3, когда работаю в знакомых базах, а в остальных - на ноль или даже отрицательное число.

Большинство профессиональных библиотекарей, окончивших университет со степенью магистра, владеет поиском электронной информации на 9 или 10.

Почему это происходит? Успешный поиск в электронных базах данных требует подготовки и постоянной практики. Понимание схем классификации, по которым построены базы данных, требует энергии, времени и денег для прослушивания специального библиотечного курса, потому что на одной инструкции здесь не выедешь.

Приведу пример. Предположим, ваш город проводит торги с частными компаниями, специализирующимися на уборке мусора, так как держать штатных мусорщиков на городском бюджете экономически нецелесообразно. Из разных источников вы знаете, что мусороуборочный бизнес находится под контролем мафии, и вы решаете предпринять самостоятельные изыскания, чтобы выявить газетные статьи по этому поводу.

Вы знаете также, что сила баз данных в их способности объединять несоизмеримые понятия с тем, чтобы избавить вас от необходимости искать иголку в стоге сена - вся информация, не имеющая отношения к делу, при этом исключается. Для одной части уравнения вы подбираете такие ключевые слова, как "оргпреступность", "мафия", "Коза ностра", для другой - "мусор", "уборка", "помойка". Каким-то образом вы выходите на нужную базу данных, вводите поисковые термины и получаете миллион ссылок на опубликованные статьи, отвечающие введенному запросу. Почему? Да потому, что "уборка" может относиться к уборке помещения, уборке урожая, а "помойка" может относиться к банным процедурам. Не говоря уже о козе, которая домашнее животное. В результате вы завалены кучей материалов, не имеющих никакого отношения к вашей теме. Чаще всего это случается, когда поиск ведется в полнотекстовой базе данных и не ограничен, скажем, заголовками или аннотациями статей.

И пока вы силитесь на ходу изменить ключевые слова, проходит время, и стоимость поиска поднимается.

Бывает и так, что вам приходится искать ключевые слова, соответствующие нужной вам теме, которые совсем не совпадают с вашим выбором на основе простого человеческого языка, на котором говорите вы и все остальные (кроме библиотекарей). Библиотекари индексируют тексты совсем не так, как это сделали бы мы с вами, поэтому они могут найти то, что нам не под силу.

Помучившись с поиском без посторонней помощи, вы можете заключить, что нужной вам информации нет - и жестоко ошибетесь.

Мне пришлось потерять кучу времени в поисках материалов для документального телефильма об упадке коммерческого рыболовства во всем мире. Только после того, как я обратился к квалифицированным библиотекарям, удалось получить полезные сведения, которые даже в специальных журналах публиковались нечасто. Если бы я не знал о трудностях поиска и моих неблестящих способностях, я мог бы заключить, что нужных мне сведений вообще не существует.

Однако технический прогресс расширяет ваши возможности, удешевляя и ускоряя поиск информации.

CD-ROM

Компактные диски CD-ROM с записанной информацией не отличаются от дисков с музыкальными записями, которые вы покупаете для дома. Для хранения информации диски CD-ROM больше подходят, чем гибкие диски. Емкость одного диска CD-ROM 600 Мегабайтов, что эквивалентно 300 000 страницам печатного текста. Для сравнения: я еще пользуюсь гибкими дисками старого образца, вмещающими эквивалент 270 страниц печатного текста, а компьютер IBM XT, на котором я писал эту книгу, имеет жесткий диск емкостью 10 Мегабайтов.

Многие поставщики коммерческих баз данных в компьютерных сетях предлагают на рынке ежегодно обновляемую информацию в записи на CD-ROM. Публичные, университетские, редакционные библиотеки стали выписывать CD-ROM так же, как ранее выписывали газеты и справочные издания. Так, газета "Стар-Трибьюн" (Индианаполис) получает на CD-ROM рефераты газетных статей, рефераты журнальных статей (издатель Universiry Microfilm Inc.) и полный текст "Нью-Йорк Таймс".

Старший библиотекарь редакции говорит, что выписал эти три издания на CD-ROM в целях экономии. Журналисты приходят в библиотеку и сами находят нужные материалы. В противном случае пришлось бы по их запросам вести поиск в компьютерных сетях, что привело бы к дополнительным затратам.

В публичных и университетских библиотеках выбор информации на CD-ROM шире. Так, библиотека Университета Миннесоты выписывает порядка 40 изданий на CD-ROM.

Чем хороши такие издания? Давайте посмотрим.

А для вас - бесплатно

Статья была опубликована под блестящим заголовком "Невольный обман в подготовке журналистов". Да и подзаголовок был не хуже: "Овладение компьютерными базами данных необходимо для серьезной журналистики. Так почему же журфаки не додают нам?"

Автор статьи, профессор журналистики Дж. Т. Джонсон сетовал в июньском 1992 года номере журнала "Квилл", что факультеты журналистики недостаточно, а то и вовсе не готовят студентов к вступлению в новую эпоху применения в журналистике компьютерных технологий, не учат их обработке цифровой информации, анализу данных и - особенно - поиску информации в электронных базах данных. Следом за этой статьей журнал опубликовал две популярные статьи о сетевых ресурсах.

В сентябрьском номере было опубликовано письмо в редакцию, в котором преподаватель одного из колледжей разъясняет, что компьютерные дисциплины у них не преподаются из-за отсутствия денег на поиск в электронных базах данных.

А как насчет бесплатной практики?

Сейчас все труднее найти научную или публичную библиотеку, где не существовало бы считывающего устройства CD-ROM для читателей.

Садитесь за компьютер и задавайте вопросы. Современные программы дружественны пользователю и не делают исключения для журналистов. Вам надо только решить для себя, что вы хотите узнать.

Во многих случаях к библиотечному CD-ROM придается принтер. Вам даже не придется делать записи.

А вашей организации это не будет стоить и цента.

Сразу же оговоримся, что в этом случае вы будете иметь дело лишь с библиографическими базами данных. Иначе говоря, на выходе вы получите не полные тексты статей, а лишь библиографическое описание (автор, заглавие, источник) и аннотации, по которым можно судить, соответствует ли статья вашим потребностям. Возможно, что саму статью вы найдете тут же в библиотеке. В крайнем случае придется обратиться в редакцию издания, опубликовавшую статью, и попросить копию. Обычно такие просьбы журналистов встречают благожелательно.

Познакомьтесь со стратегией поиска на примере автономных баз данных

Несмотря на то, что базы данных, записанные на CD-ROM, предоставляют меньше вариантов стратегии поиска, чем сетевые базы данных, работающие в интерактивном режиме, интенсивные тренировки, которыми вам следовало бы заняться, помогут прочувствовать системы классификации и их построение.

Само по себе это не сделает из вас специалиста по исследованию сетевых ресурсов. Вовсе нет. Но это прибавит вам опыта в грамотном формулировании запросов, что поможет библиотекарю более целенаправленно вести поиск нужной вам информации. Вы научитесь облекать ваши идеи в наиболее подходящие ключевые слова и лучше довести их до библиотекаря.

Стратегия поиска

Сейчас, когда имеется множество баз данных, записанных на CD-ROM, я выработал для себя методику поиска информации, которой хочу поделиться с читателем.

  • Сначала я совершаю небольшой обзор баз данных, записанных на CD-ROM, в поисках темы, которая могла бы меня заинтересовать. Библиографические базы данных предоставляют возможность познакомиться со многим из того, что уже публиковалось в популярной прессе по моей теме. В ходе просмотра статей я выписываю основные понятия и фамилии авторов, показавшихся мне особо освещенными и серьезными.
    Я снова обращаюсь к базе данных, используя для поиска новые ключевые слова, фамилии авторов и другие поисковые признаки, полученные в ходе первого знакомства с материалом по теме.
  • Далее я решаю, стоит ли заказывать платный поиск в электронных системах информации. Обычно решение бывает положительным по двум причинам. Во-первых, CD-ROM включает только источники, известные на момент выпуска компакт-диска. Во-вторых, доступные мне базы данных на CD-ROM редко включают ссылки на специальные издания, в которых можно найти квалифицированное мнение экспертов.
  • Теперь я могу обратиться к специалисту по сетевым ресурсам, показать ему результаты своих изысканий и нацелить поиск на нужные материалы, что, кстати, сократит время поиска и сделает его дешевле.

Фирма-поставщик собирает на одном узле множество электронных баз данных, предоставляя пользователю вести поиск в каждой из них, используя одни и те же команды.

Лучшая и крупнейшая фирма-поставщик DIALOG, принадлежащая газетному концерну "Найт-Риддер", объединяет около 400 баз данных.

Я пользуюсь этой информационной системой каждый раз, когда я заказываю поиск. Особенность системы DIALOG в том, что поиск осуществляется одновременно во всех базах данных, входящих в систему, и вы сразу можете видеть количество записей, совпадающих с введенным в компьютер поисковым признаком. Это свойство информационной системы принято называть глобальным поиском. Если необходима вспомогательная информация об отдельных лицах, я обращаюсь к следующим базам данных, входящим в систему DIALOG:

  • Новости "Ассошиэйтед Пресс" (ведется в машиночитаемой форме с 1984 года).
  • База данных по искусству и гуманитарным наукам, включающая аннотации статей из 1 300 специальных журналов многих стран мира и выборочно еще из 5 000 естественнонаучных журналов.
  • "Указатель рецензий на книги" (более 2 млн записей, начиная с 1969 года).
  • "Книги, имеющиеся в продаже" (более 1,3 млн записей).
  • Рефераты материалов официального издания Конгресса США "Congressional Record", содержащего стенограммы прений и документы, относящиеся к обсуждаемым вопросам (в машиночитаемой версии ведется в 1981 года, около 500 тыс. записей).
  • Указатель юридических материалов (около полумиллиона записей с 1980 года на основе просмотра 750 специальных журналов и других источников). Статьи в юридических журналах - золотая жила информации, поскольку в Соединенных Штатах мы тянем в суд все наши проблемы. Авторы статей рассматривают положения закона, их юридическое толкование, обычно указывают на положительные качества закона, хотя чаще сосредоточиваются на отрицательных и дают рекомендации по их совершенствованию. Часто эта база данных оказывается самой полезной.
  • Указатель журнальных статей с обратно хронологическим охватом до 1973 года, а в некоторых случаях - до 1959 года. Содержит свыше 2,5 млн записей.
  • Базы данных "Газеты" - свыше 5 млн записей.
  • База данных по общественным наукам, включающая более 2 млн аннотаций статей 1 500 общественнонаучных журналов и выборочно из 3 000 журналов естественнонаучной, физической и биомедицинской тематики.

В зависимости от наличия денег на расширение поля поиска можно добавить некоторые базы данных, не входящие в информационную систему DIALOG:

  • База данных PTS, включающая материалы 400 бюллетеней деловой и торговой информации. Здесь можно найти сведения, которых нет ни в одной другой базе данных.
  • База данных Scisearch - более 10 млн аннотаций из 2 600 научно-технических журналов.
  • "Документы американской политологии" - около 60 тыс. записей на основании сплошного просмотра 150 политических журналов США с 1975 года.

Наблюдательный читатель, очевидно, заметил, что справочник, о котором говорилось выше, насчитывает более 5 000 баз данных, а информационная система DIALOG включает "всего лишь" около 400.

А где все остальные?

Начнем с того, что цифры вводят в заблуждение. Например, в справочнике электронная версия каждой газеты засчитывается как самостоятельная база данных, а в информационной системе DIALOG все они объединены в одну базу данных "Газеты". Но в общем и целом с читателем надо согласиться. Существует много баз данных, о которых не имеют представления большинство работников редакционных, публичных и университетских библиотек, которые предпочитают вести поиск в информационных системах, предоставляемых несколькими фирмами-поставщиками электронных баз данных. Некоторые базы данных, которые могут пригодиться журналистам, но не входят в известные информационные системы, перечислены в подверстке к этой главе.

Правительственные базы данных

Федеральное правительство США - крупнейший в мире производитель информации. В определенном смысле информация является его единственной продукцией. Однако с начала 1980-х годов федеральное правительство выхолащивает, задерживает и приватизирует информацию, применяя для этого множество способов, каждый из которых не сулит ничего хорошего людям, для которых своевременная и правдивая информация - хлеб насущный.

Ирония заключается в том, что все это происходит в век информации, который долгое время провозглашался и, наконец, действительно наступил, в том числе и для правительства, если судить хотя бы по возрастающей компьютеризации его деятельности.

Последнее обстоятельство имеет положительное значение. Федеральное правительство настолько громоздко, что многие его ведомства и органы были вынуждены перейти на электронное хранение информации. Ключом к определению характера правительственной информации в компьютерных сетях является справочник "Базы данных федерального правительства".

Более того, в 1993 году в конгресс был внесен законопроект, облегчающий доступ к электронной информации правительственных учреждений. Это произошло на закате администрации Буша. Пока не ясно, какая судьба постигнет этот законопроект при администрации Клинтона.

На уровне штатов и органов местного самоуправления доступ к электронной информации существенно расширяется. Например, правительство штата Миннесота в течение 9 лет ведет общедоступную базу данных по демографии и естественным ресурсам штата. В округе Хеннепин того же штата можно вести поиск в электронной базе данных по судебным документам, по актам на земельную собственность и частично - по налогу на имущество.

Базы данных, которых нет в арсенале вашего библиотекаря

Большинство редакционных библиотекарей полагаются в своей работе на несколько фирм-поставщиков баз данных, которые можно пересчитать по пальцам одной руки. Это - DataTimes, DIALOG, Lexis-Nexis, VuText. Однако есть много баз данных, не входящих ни в одну из этих информационных систем. Предлагаю для примера несколько баз данных и частичные сведения об их содержании, которые могут пригодиться в журналистских расследованиях.

  • Duns Legal Search - публичные акты хозяйствующих субъектов всех 50 штатов, в том числе их информационные коммерческие коды, иски и судебные решения.
  • Facilities Index System - информация примерно о полумиллионе предприятий и участков, находящихся под наблюдением Агентства по охране окружающей среды в связи с наличием на них опасных материалов.
  • Family Tree - "генеалогические древа" 200 000 корпораций и их дочерних компаний.
  • Электронная доска объявлений Администрации по контролю за продуктами питания и медикаментами (подразделение Министерства здравоохранения и коммунальных служб), где, в частности, помещаются еженедельные бюллетени об отзыве из продажи лекарственных средств.
  • Доклады и документы Главного контрольно-финансового управления - контрольного органа конгресса, ревизующего расходование бюджетных средств ведомствами исполнительной власти.
  • Информация о деятельности федерального правительства (поставщик Dun & Bradstreet) включает, в частности, данные о субсидиях и грантах правительства организациям бизнеса, фондам и учебным заведениям.
  • База данных по долгосрочным экономическим прогнозам, предлагаемая фирмой-поставщиком WEFA Group.
  • База данных Национального центра экспертной помощи (подразделение Библиотеки конгресса), содержащая адреса и телефоны 14 000 организаций, в которые можно обратиться с запросами самой разнообразной тематики.
  • People finder (поставщик Information America) предлагает адреса, телефоны, иногда даты рождения и другие сведения примерно о 100 млн человек.
  • Prenfice-Hall On-Line - информация о кредитоспособности примерно 60 миллионов физических и юридических лиц в 9 штатах.
  • Информационная служба General Electric ведет, в частности, базу данных по экономическим показателям 19 штатов и 40 городов США.
  • State Macro - 47 тыс. месячных, квартальных и годовых экономических сводок по всем 50 штатам.
  • Информационная служба по налогообложению. База данных содержит оценки, подготовленные окружными налоговыми инспекторами 7 штатов.
  • Информационная служба по праву собственности на имущество. База данных содержит информацию окружных клерков 7 штатов и судов по банкротствам.
  • Westlaw Federal Legistative History Database. База данных включает не только тексты федеральных законов, но и "законодательную историю" (кто внес законопроект, его обсуждение и голосование по нему).
  • Westlaw Federal Tax Information включает, в частности, материалы всех судебных процессов по делам о налогах с 1954 года.
  • Westlaw Government Contacts. База данных, в частности, содержит тексты и аннотации решений федеральных судов и слушаний в Администрации по делам малого бизнеса.

Джон УЛЛМЕН

Материал сайта Национального института прессы

К оглавлению книги...

Другие материалы по теме...


СМИ вообще | пресса | радио | телевидение | интернет


Если у вас тоже есть полезные материалы для журналисткой братии, присылайте их по адресу ...
Создадим вместе самую ПОЛЕЗНУЮ библиотеку для журналистов!

© Максим Пасютин, 2004

Рейтинг@Mail.ru
Сайт создан в системе uCoz