Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Алгоритмы поиска и индексации

Читайте также:
  1. CТРУКТУРЫ ДАННЫХ И АЛГОРИТМЫ
  2. Алгоритм поиска с возвращением, их реализация с помощью рекурсий и динамических структур.
  3. Алгоритмы внутренней сортировки
  4. Алгоритмы замещения страниц
  5. Алгоритмы и их свойства. Представление алгоритмов
  6. Алгоритмы и их свойства. Представление алгоритмов
  7. Алгоритмы сортировки в Delphi
  8. Алгоритмы шифрования
  9. В поисках выхода

Первые работы, касающиеся поиска текста, появились во второй половине XX в., и основные подходы, заложенные в них, и по сей день успешно используются всеми поисковыми системами. Наиболее распространенными методами поиска текстовых документов являются булев поиск, векторный и вероятностный.

Булев поиск опирается на использование инвертированного индекса ключевых слов, т. е. таблицы, в которой для каждого ключевого слова перечисляются все документы, где оно встречается. Главным достоинством этого алгоритма является возможность связывания слов запроса логическими операциями, например, он позволяет осуществить поиск по запросу «кофе или чай» и получить в результате объединение множеств документов, содержащих слова «кофе» и «чай». К недостаткам этого алгоритма следует отнести невозможность определения релевантности запросу полученной выборки документов и, как следствие, невозможность ее сортировки.

 

Мультимедийные массивы.

Мультимедиа – это сокращенное обозначение информации, отличающейся от простых текста и графики. Мультимедиа – это звуки, музыка, видео, анимация, в последнее время оккупировавшие диски наших компьютеров, загромоздившие их гигабайтами полезной и бесполезной информации. Мультимедиа – это мощнейшие трехмерные ускорители на видеокартах, это звуковые контроллеры, ставшие (наконец-то) стандартом, CD- и DVD-диски и соответствующие им приводы. Мультимедиа – это Web-страницы, пестрящие анимацией, оглушающие каждого встречного приветственной музыкой. Мультимедиа – это символ современного компьютерного мира.

Разумеется, мы не можем пройти мимо такой насущной темы. Да и сами создатели Dreamweaver не могли ее проигнорировать. Dreamweaver оснащен впечатляющими средствами помещения на Web-страницы мультимедийного содержания, да и вообще любых внедренных объектов. И мы их сейчас рассмотрим.

Но, прежде всего, решим, куда же помещать наше мультимедийное содержание. Как правило, его помещают на главную страницу, и оно будет проигрываться либо при ее (страницы) открытии, либо после того, как пользователь нажмет на кнопку, запускающую проигрывание. Так поступим и мы. И еще: это мультимедийное содержание не должно быть очень большим, иначе пользователь устанет ждать, пока оно загрузится, и уйдет с вашего сайта.

Не будем говорить о проблеме соблюдения авторских прав – это и так понятно, ведь практически любое авторское произведение защищено законодательством от кражи и незаконного копирования (что, собственно, одно и то же). В качестве решения проблемы вы можете поместить на свою страницу небольшой кусочек, скажем, музыкального произведения или фильма, сопроводив его текстом, предлагающим пользователю купить соответствующее произведение на кассете или компакт-диске, если оно ему понравится. Это обычная практика музыкальных сайтов, соблюдающих (или пытающихся соблюдать) законы.

Некоторые типы мультимедийных данных поддерживаются Web-обозревателем непосредственно. (Хотя мультимедийными данными это назвать сложно.) Как вы поняли, речь идет об обычных растровых изображениях в формате GIF, JPEG или PNG (они помещаются на страницы с помощью тега <IMG>). Internet Explorer также поддерживает свой собственный тег <BGSOUND> для привязки к странице фонового музыкального сопровождения и атрибут DYNSRC тега <IMG>, с помощью которого на страницу можно поместить фильм. Но эти возможности не являются стандартными, поэтому мы не будем их рассматривать. Если вы хотите узнать о них побольше, обратитесь к электронному руководству по HTML.

Но поддержка очень и очень многих форматов данных в Web-обозреватель не заложена – форматов так много, что охватить все просто невозможно. Проблема решается использованием дополнительных программ. Каждая такая программа "отвечает" за свой формат данных. И, когда Web-обозреватель получает какие-либо данные, которые он не может обработать непосредственно, он загружает соответствующую программу.

Мультимедийные данные, не поддерживаемые Web-обозревателем, помещаются на страницу с помощью особого тега. С помощью соответствующего атрибута задается имя файла данных, который и будет обрабатываться дополнительной программой. Программа читает данные из файла, обрабатывает их и генерирует на их основе какой-то экранный вывод, либо проявляет себя каким-то иным образом.

 

Тестовые программы.

Достоинства программы:
- результат теста выдается сразу после ответа на все вопросы;
- можно двигаться только вперед, а можно вернуться и исправить ответ (устанавливается преподавателем);
- при выполнении теста показывается количество вопросов и оставшееся время;
- при выполнении теста компьютер сам выбирает из банка данных нужное количество вопросов;
- при выполнении теста разными учащимися в одинаковых вопросах меняются местами дистракторы;
- при составлении вопроса информация может быть представлена графически (рисунок в формате.bmp, рисунок или график из презентаций PowerPoint);
- можно создавать тесты, ориентированные на успех/провал или с уровнем прохождения каждой оценки;
- после прохождения теста результат можно распечатать или посмотреть в папке тестируемого (позволяет анализировать качество знаний каждого учащегося);
- после выполнения теста можно посмотреть свои ошибки. englishlearner www.englishjet.com/

Обучающие программы.

Программы для пополнения словарного запаса, контроля знаний, словари, программы для прослушивания и просмотра английских слов и фраз, тренировки устного и письменного английского, персональные лингафонные кабинеты.

“Businesstalk / Бизнес английский” – программа для изучения английского языка, которая предназначена для изучения основных фраз, употребляемых во время работы специалистами разных профессий и при разнообразных ситуациях: при беседе по телефону с клиентами, руководителями, при организации бизнес встреч, во время командировок, при проведении переговоров, в ходе продаж.

“TheSkyPronunciationSuite” - программа для изучения английского языка, главная цель которой – приобретение и улучшение навыков произношения. В компьютерном приложении сочетаются в себе такие варианты учебных пособий как: видеокурсы, тесты, аудиокурсы и даже игры для изучения английского языка.

Электронные библиотеки.

Упорядоченная коллекция разнородных электронных документов снабженных средствами навигации и поиска. Скачать или онлайн. Самый популярный формат— HTML. Форматы для скачивания — заархивированный TXT; RTF и DOC. Книги, изобилующие математическими формулами и сложными схемами, после сканирования переводить в текстовый формат намного сложнее, поэтому часто их хранят в графическом формате, обычно DjVu и PDF.

Всемирная цифровая библиотека (англ. World Digital Library) — проект Библиотеки Конгресса. В библиотеке будут собраны оцифрованные версии ценнейших материалов по истории и культуре.

http://lib.ru/ – Библиотека Максима Мошкова.

http://www.philology.ru/ – Труды по языкознанию и литературоведению.

http://www.gumer.info/ – лучшая библиотека гуманитарной направленности. История, литература, журналистика, педагогика, философия, культурология, экономика, юриспруденция, литературоведение, языкознание и т.д.

http://lib.rus.ec/ – совсем ещё недавно была лучшей русскоязычной библиотекой. Теперьплатная – 10$ в месяц.

http://rvb.ru/ – Русская виртуальная библиотека. Подборка произведений русской литературы XVIII, XIX и XX вв.

 

Microsoft Word. Основные характеристики.

(Набор,модификация,шрифты стили,размеры,разбить на страницы колонтикулы и сноски,правописание,синонимы,авт.перенос,встраивание,верстка,шаблоны,оформление, DOC/X)

Microsoft Power Point. Основные характеристики.

(Создание,оформ. презент.,слайды разметка,комплексное мульт.содержание,демонстрация,заметки,рисование,панель форматир.,анимации,PPT.)

Adobe Reader. Общие характеристики.

(беспл.прог.для.PDF,просморт,копирование,печать,воспр.мультимедиа,электр.книги,поиск в инете из документа,доп.к веб браузеру,для слабозрячих.)

Adobe Fine Reader. Общие характеристики.

(Опт.распозн.символов,ABBYY,извлеч.текста из цифр.изобр.,188 языков,орфогр.45,доб.неизв.слов.в словарь,платно онлайн,1993,сохр.в других форматах.)

Структура Интернет.

(Связь несморя не на что,нет центрального хозяина,провайдер(косяки структуры разные)-пользоват./компании,звенья,обмен.инф между 2 комп.,сервера с сайтами и файлами,Совет по архитектуре Интернета.)

Система поиска в интернете(поисковики)

При вводе пользователем необходимого запроса из ее базы изымаются проиндексированные документы, содержащие ключевые слова, которые вводились в поиск. Для поиска информации в Интернете разработаны специальные информационно-поисковые системы. Поисковые системы имеют обычный адрес и отображаются в виде Web-страницы, содержащей специальные средства для организации поиска (строку для поиска, тематический каталог, ссылки). Для вызова поисковой системы достаточно ввести ее адрес в адресную строку Браузера.

Каждая поисковая система имеет свою форму составления запроса. Принцип один, но могут различаться используемые символы или операторы. Требуемые формы запроса различаются также в зависимости от сложности программного обеспечения поисковых систем и предоставляемых ими услуг. Так или иначе, каждая поисковая система имеет раздел "Help" ("Помощь"), где все синтаксические правила, а также рекомендации и советы по поиску доступно объясняются.

Рубрикаторы (классификаторы) – поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска (например, если необходимо найти значение какого-то слова, то сначала в классификаторе нужно найти словарь, а затем уже в нем найти нужное слово).

Словарные поисковые системы – это мощные автоматические программно-аппаратные комплексы. С их помощью просматривается (сканируется) информация в Интернет. В специальные справочники-индексы заносятся данные о местонахождении той или иной информации. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса (URL), на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу. Большинство современных поисковых систем являются смешанными.

Помните, что поисковые системы не производят самостоятельную информацию. Поисковая система – это лишь посредник между обладателем информации (сайтом) и Вами. Базы данных постоянно обновляются, в них вносятся новые адреса, и это нужно учитывать при поиске информации.

Сайты, представляющие филологический интерес.

http://www.philology.ru/ -рус.фил.порт.,компактно инф.,ядро-тексты(статьи,мет.пособибия.)

http://www.gramma.ru/ -культура письм.речи.,нормы языка,консульт.,ответы,вопросы.

http://www.gramota.ru/ -спарв-инф.портал.,все о рус.яз.

Персональные сайты лингвистов

http://uztranslations.net.ru/ -ин.литература,словари,статьи,яз.проги,рефераты,уч.мат.

Проект Знаете слово? -1800 интересных слов с толкованием, этимологией и иллюстрациями.

http://www.telegraph.ru/misc/day/dis.htm - Словарь устаревших и диалектных слов.

http://slangdictionary.ru/ - словарь молодёжного сленга

http://audiobooks.ulitka.com/ - аудиокниги. Много.

http://www.filminenglish.ru/ -фильмы на англ.

 

Пакеты цифровой обработки звучащего текста.

 

Электронные словари.

В электр.прибоах,быстро найти нужное,превод в обе стороны, Внутренне устроен как база данных со словарными статьями, предназначенными для пользователей, AtomicDic-прога

для перевода не требуется подключения к интернету

компактный размер

возможность самостоятельного добавления пользователем новых вариантов перевода

предусмотрена возможность буфера обмена

стандартный словарь включает в себя более 52 тысяч словарных статей

малое потребление системных ресурсов

не требует установки

словарь-WordNet — это семантическая сеть для английского языка.

Словарь состоит из 4 сетей: существительных, глаголов, прилагательных и наречий.примерами употребления слов в контексте.

Контекстные словари.

QDictionary

Этот способ перевода будет работать в Internet Explorer (и в браузерах, построенных на его основе), Outlook Express, HTML Help (CHM файлы), Notepad, WordPad и ICQ.

NeoDic

TranslateIt!

Обратный может быть или слов+словосоч,озвучка,настройка интерфейса.

Программы для запоминания слов и лингво-тренажеры.




Дата добавления: 2014-12-18; просмотров: 173 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.012 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав