СМИ вообще | пресса | радио | телевидение | интернет | |
СМИ вообще 01 ноября 2004 года Глава 4.
Максимально использовать возможности баз данных Книга "Журналистские расследования: современные методы и техника" Несмотря на то, что многие журналисты пользуются благами электронных библиотек, большинство библиотекарей обращаются лишь к ничтожной доле имеющихся 5 000 электронных баз данных. В этой главе говорится о том, как лучше использовать доступные вам базы данных, а в подверстке - как расширить круг электронных источников информации в вашей работе. Вам уже известно, что электронные базы данных - великолепное средство получения вспомогательной информации практически на любую тему. Поиск информации в базах данных стал обычным делом в журналистских расследованиях, да и в повседневной работе печатных изданий и вещательных станций. Возможно, и вы привычно пользуетесь этим источником информации. Не исключено, что вы часто общаетесь с редакционным библиотекарем, который помогает вам в поиске материала. Но знаете ли вы, какие информационные возможности хранят в себе электронные базы данных, если поиск ведет мастер своего дела? В качестве примера приведем случай из практики газеты "Филадельфия инквайрер", когда электронная информация помогла Дону Барлетту и Джеймсу Стилу в подготовке серии статей, увенчавшей их второй Пулитцеровской премией. Темой этих статей были налоговые поблажки, которые конгресс предоставлял отдельным лицам и корпорациям. Конкретные факты выявлялись с большим трудом, поскольку в общественно-доступных документах часто отсутствовали имена облагодетельственных лиц и названия компаний. Вот что рассказывает сам Барлетт: "Из законопроекта о налогах можно было извлечь информацию о предоставленных льготах только в таком виде: Корпорация, зарегистрированная в штате Делавер 10 августа 1928 года, долговые обязательства которой на 28 мая 1986 года составляли:
Я позвонил нашему библиотекарю Дженнифер Юинг, молодой женщине, с которой мы уже несколько лет сотрудничали. Произошел примерно такой разговор: Барлетт: Нам нужны сведения об одной компании. Юинг: Название, пожалуйста. Барлетт: Мы не знаем. Последовала продолжительная пауза, во время которой Дженнифер, привыкшая к самым невероятным просьбам с нашей стороны, тщательно подбирала слова, понося про себя наших предков. Наконец, она отреагировала. Юинг: Может быть, хоть намекнете, что за компания. Барлетт: У нас есть пара-другая цифр. Я дал ей сумму и сроки погашения задолженности. Через 5 минут раздался ответный звонок, и Дженнифер сообщила нам, что название интересующей нас компании "FMC Corp". В базе данных службы финансовых новостей Доу Джонс, она отыскала статью из "Уолл-Стрит Джорнал" о задолженности "FMC Corp.", сумма и сроки погашения которой совпадали с нашими цифрами. Дополнительная проверка по справочнику компаний "Standard & Poor" показала, что "FMC Corp." зарегистрирована в штате Делавер 10 августа 1928 года". Для нас, простых смертных, этот рассказ звучит как захватывающая детективная история. А для Дженнифер Юинг, которая, сидя за компьютером, разыскивает информацию для "Филадельфия инквайрер", это была не такая уж сложная задача. Самое трудное дело - вычислить из множества доступных ей баз данных ту самую, где наиболее вероятно присутствуют нужные сведения. Приведенный случай в какой-то мере иллюстрирует достоинства и недостатки поиска информации в базах данных. Достоинства Для журналиста - для любого журналиста, независимо от места работы - электронные базы данных по-прежнему представляют величайший, самый оперативный источник новейшей информации. К тому же это еще и экономичный источник информации. Поиск в базах данных перестал быть привилегией преуспевающих газет, хотя широкое распространение этой технологии в СМИ еще впереди. С каждым годом сотнями прирастают общедоступные базы данных. Согласно периодическому справочнику "Cuadra Directory of Databases", издаваемому исследовательской корпорацией "Gale", в 1979-1980 годах насчитывалось 400 баз данных, созданных 221 организацией. В выпуске от 1 июля 1991 года "Cuadra" перечисляет уже 5 026 баз данных, созданных 2 158 организациями. Информация, содержащаяся в базах данных, избавляет нас от необходимости заново изобретать велосипед и напоминает журналистам, что велосипед уже изобретен и многие на нем катаются в свое удовольствие. Недостатки Почти для всех журналистов поиск информации в электронных базах данных остается двухступенчатым процессом, отдаляющим журналиста от самостоятельного поиска. У журналиста появляется идея статьи. Библиотекарь переводит эту идею в параметры поиска, отбирает базу (или базы) данных, осуществляет поиск и передает результаты журналисту, который смотрит, соответствуют ли они запросу. До недавнего времени я думал, что так оно и должно быть. Ведь если информацию помещают в базу данных библиотекари, то кто кроме них сможет лучше извлечь ее? Я, например, прослушал курс поиска информации, готовясь к защите диссертации в Миссурийском университете, участвовал в семинарах по поиску информации, проводимых поставщиками компьютерной техники, писал на эту тему и время от времени сам занимался поиском на протяжении более 10 лет. По десятибалльной шкале я оцениваю свои способности к поиску на 3, когда работаю в знакомых базах, а в остальных - на ноль или даже отрицательное число. Большинство профессиональных библиотекарей, окончивших университет со степенью магистра, владеет поиском электронной информации на 9 или 10. Почему это происходит? Успешный поиск в электронных базах данных требует подготовки и постоянной практики. Понимание схем классификации, по которым построены базы данных, требует энергии, времени и денег для прослушивания специального библиотечного курса, потому что на одной инструкции здесь не выедешь. Приведу пример. Предположим, ваш город проводит торги с частными компаниями, специализирующимися на уборке мусора, так как держать штатных мусорщиков на городском бюджете экономически нецелесообразно. Из разных источников вы знаете, что мусороуборочный бизнес находится под контролем мафии, и вы решаете предпринять самостоятельные изыскания, чтобы выявить газетные статьи по этому поводу. Вы знаете также, что сила баз данных в их способности объединять несоизмеримые понятия с тем, чтобы избавить вас от необходимости искать иголку в стоге сена - вся информация, не имеющая отношения к делу, при этом исключается. Для одной части уравнения вы подбираете такие ключевые слова, как "оргпреступность", "мафия", "Коза ностра", для другой - "мусор", "уборка", "помойка". Каким-то образом вы выходите на нужную базу данных, вводите поисковые термины и получаете миллион ссылок на опубликованные статьи, отвечающие введенному запросу. Почему? Да потому, что "уборка" может относиться к уборке помещения, уборке урожая, а "помойка" может относиться к банным процедурам. Не говоря уже о козе, которая домашнее животное. В результате вы завалены кучей материалов, не имеющих никакого отношения к вашей теме. Чаще всего это случается, когда поиск ведется в полнотекстовой базе данных и не ограничен, скажем, заголовками или аннотациями статей. И пока вы силитесь на ходу изменить ключевые слова, проходит время, и стоимость поиска поднимается. Бывает и так, что вам приходится искать ключевые слова, соответствующие нужной вам теме, которые совсем не совпадают с вашим выбором на основе простого человеческого языка, на котором говорите вы и все остальные (кроме библиотекарей). Библиотекари индексируют тексты совсем не так, как это сделали бы мы с вами, поэтому они могут найти то, что нам не под силу. Помучившись с поиском без посторонней помощи, вы можете заключить, что нужной вам информации нет - и жестоко ошибетесь. Мне пришлось потерять кучу времени в поисках материалов для документального телефильма об упадке коммерческого рыболовства во всем мире. Только после того, как я обратился к квалифицированным библиотекарям, удалось получить полезные сведения, которые даже в специальных журналах публиковались нечасто. Если бы я не знал о трудностях поиска и моих неблестящих способностях, я мог бы заключить, что нужных мне сведений вообще не существует. Однако технический прогресс расширяет ваши возможности, удешевляя и ускоряя поиск информации. CD-ROM Компактные диски CD-ROM с записанной информацией не отличаются от дисков с музыкальными записями, которые вы покупаете для дома. Для хранения информации диски CD-ROM больше подходят, чем гибкие диски. Емкость одного диска CD-ROM 600 Мегабайтов, что эквивалентно 300 000 страницам печатного текста. Для сравнения: я еще пользуюсь гибкими дисками старого образца, вмещающими эквивалент 270 страниц печатного текста, а компьютер IBM XT, на котором я писал эту книгу, имеет жесткий диск емкостью 10 Мегабайтов. Многие поставщики коммерческих баз данных в компьютерных сетях предлагают на рынке ежегодно обновляемую информацию в записи на CD-ROM. Публичные, университетские, редакционные библиотеки стали выписывать CD-ROM так же, как ранее выписывали газеты и справочные издания. Так, газета "Стар-Трибьюн" (Индианаполис) получает на CD-ROM рефераты газетных статей, рефераты журнальных статей (издатель Universiry Microfilm Inc.) и полный текст "Нью-Йорк Таймс". Старший библиотекарь редакции говорит, что выписал эти три издания на CD-ROM в целях экономии. Журналисты приходят в библиотеку и сами находят нужные материалы. В противном случае пришлось бы по их запросам вести поиск в компьютерных сетях, что привело бы к дополнительным затратам. В публичных и университетских библиотеках выбор информации на CD-ROM шире. Так, библиотека Университета Миннесоты выписывает порядка 40 изданий на CD-ROM. Чем хороши такие издания? Давайте посмотрим. А для вас - бесплатно Статья была опубликована под блестящим заголовком "Невольный обман в подготовке журналистов". Да и подзаголовок был не хуже: "Овладение компьютерными базами данных необходимо для серьезной журналистики. Так почему же журфаки не додают нам?" Автор статьи, профессор журналистики Дж. Т. Джонсон сетовал в июньском 1992 года номере журнала "Квилл", что факультеты журналистики недостаточно, а то и вовсе не готовят студентов к вступлению в новую эпоху применения в журналистике компьютерных технологий, не учат их обработке цифровой информации, анализу данных и - особенно - поиску информации в электронных базах данных. Следом за этой статьей журнал опубликовал две популярные статьи о сетевых ресурсах. В сентябрьском номере было опубликовано письмо в редакцию, в котором преподаватель одного из колледжей разъясняет, что компьютерные дисциплины у них не преподаются из-за отсутствия денег на поиск в электронных базах данных. А как насчет бесплатной практики? Сейчас все труднее найти научную или публичную библиотеку, где не существовало бы считывающего устройства CD-ROM для читателей. Садитесь за компьютер и задавайте вопросы. Современные программы дружественны пользователю и не делают исключения для журналистов. Вам надо только решить для себя, что вы хотите узнать. Во многих случаях к библиотечному CD-ROM придается принтер. Вам даже не придется делать записи. А вашей организации это не будет стоить и цента. Сразу же оговоримся, что в этом случае вы будете иметь дело лишь с библиографическими базами данных. Иначе говоря, на выходе вы получите не полные тексты статей, а лишь библиографическое описание (автор, заглавие, источник) и аннотации, по которым можно судить, соответствует ли статья вашим потребностям. Возможно, что саму статью вы найдете тут же в библиотеке. В крайнем случае придется обратиться в редакцию издания, опубликовавшую статью, и попросить копию. Обычно такие просьбы журналистов встречают благожелательно. Познакомьтесь со стратегией поиска на примере автономных баз данных Несмотря на то, что базы данных, записанные на CD-ROM, предоставляют меньше вариантов стратегии поиска, чем сетевые базы данных, работающие в интерактивном режиме, интенсивные тренировки, которыми вам следовало бы заняться, помогут прочувствовать системы классификации и их построение. Само по себе это не сделает из вас специалиста по исследованию сетевых ресурсов. Вовсе нет. Но это прибавит вам опыта в грамотном формулировании запросов, что поможет библиотекарю более целенаправленно вести поиск нужной вам информации. Вы научитесь облекать ваши идеи в наиболее подходящие ключевые слова и лучше довести их до библиотекаря. Стратегия поиска Сейчас, когда имеется множество баз данных, записанных на CD-ROM, я выработал для себя методику поиска информации, которой хочу поделиться с читателем.
Фирма-поставщик собирает на одном узле множество электронных баз данных, предоставляя пользователю вести поиск в каждой из них, используя одни и те же команды. Лучшая и крупнейшая фирма-поставщик DIALOG, принадлежащая газетному концерну "Найт-Риддер", объединяет около 400 баз данных. Я пользуюсь этой информационной системой каждый раз, когда я заказываю поиск. Особенность системы DIALOG в том, что поиск осуществляется одновременно во всех базах данных, входящих в систему, и вы сразу можете видеть количество записей, совпадающих с введенным в компьютер поисковым признаком. Это свойство информационной системы принято называть глобальным поиском. Если необходима вспомогательная информация об отдельных лицах, я обращаюсь к следующим базам данных, входящим в систему DIALOG:
В зависимости от наличия денег на расширение поля поиска можно добавить некоторые базы данных, не входящие в информационную систему DIALOG:
Наблюдательный читатель, очевидно, заметил, что справочник, о котором говорилось выше, насчитывает более 5 000 баз данных, а информационная система DIALOG включает "всего лишь" около 400. А где все остальные? Начнем с того, что цифры вводят в заблуждение. Например, в справочнике электронная версия каждой газеты засчитывается как самостоятельная база данных, а в информационной системе DIALOG все они объединены в одну базу данных "Газеты". Но в общем и целом с читателем надо согласиться. Существует много баз данных, о которых не имеют представления большинство работников редакционных, публичных и университетских библиотек, которые предпочитают вести поиск в информационных системах, предоставляемых несколькими фирмами-поставщиками электронных баз данных. Некоторые базы данных, которые могут пригодиться журналистам, но не входят в известные информационные системы, перечислены в подверстке к этой главе. Правительственные базы данных Федеральное правительство США - крупнейший в мире производитель информации. В определенном смысле информация является его единственной продукцией. Однако с начала 1980-х годов федеральное правительство выхолащивает, задерживает и приватизирует информацию, применяя для этого множество способов, каждый из которых не сулит ничего хорошего людям, для которых своевременная и правдивая информация - хлеб насущный. Ирония заключается в том, что все это происходит в век информации, который долгое время провозглашался и, наконец, действительно наступил, в том числе и для правительства, если судить хотя бы по возрастающей компьютеризации его деятельности. Последнее обстоятельство имеет положительное значение. Федеральное правительство настолько громоздко, что многие его ведомства и органы были вынуждены перейти на электронное хранение информации. Ключом к определению характера правительственной информации в компьютерных сетях является справочник "Базы данных федерального правительства". Более того, в 1993 году в конгресс был внесен законопроект, облегчающий доступ к электронной информации правительственных учреждений. Это произошло на закате администрации Буша. Пока не ясно, какая судьба постигнет этот законопроект при администрации Клинтона. На уровне штатов и органов местного самоуправления доступ к электронной информации существенно расширяется. Например, правительство штата Миннесота в течение 9 лет ведет общедоступную базу данных по демографии и естественным ресурсам штата. В округе Хеннепин того же штата можно вести поиск в электронной базе данных по судебным документам, по актам на земельную собственность и частично - по налогу на имущество. Базы данных, которых нет в арсенале вашего библиотекаря Большинство редакционных библиотекарей полагаются в своей работе на несколько фирм-поставщиков баз данных, которые можно пересчитать по пальцам одной руки. Это - DataTimes, DIALOG, Lexis-Nexis, VuText. Однако есть много баз данных, не входящих ни в одну из этих информационных систем. Предлагаю для примера несколько баз данных и частичные сведения об их содержании, которые могут пригодиться в журналистских расследованиях.
Джон УЛЛМЕН Материал сайта СМИ вообще | пресса | радио | телевидение | интернет |
|
Если у вас тоже есть полезные материалы для журналисткой братии, присылайте их по адресу ... Создадим вместе самую ПОЛЕЗНУЮ библиотеку для журналистов! |
© Максим Пасютин, 2004 |
|