Книга посвящена современным подходам к получению новых знаний на основе анализа информационного пространства сети Интернет и методам обработки информационных потоков с целью выявления значимых тенденций, понятий, феноменов, их взаимосвязей.
Анализируются проблемы и феномены Интернет, топология Веб-пространства, методы доступа к информации в «скрытом» Web, рассматриваются особенности различных информационно-поисковых систем и средства интеграции Web-контента на основе XML.
Большое внимание в книге уделено новому направлению обработки текстовой информации «глубинному анализу текстов» (text mining), объединяющему в себе технологические и методологические подходы контент-анализа, компьютерной лингвистики и искусственного интеллекта.
Книга ориентирована на широкий круг читателей, интересующихся современными информационными технологиями. При этом она будет полезна и аналитикам, которые с помощью инструментов Text Mining смогут повысить эффективность и качество своей работы.
Содержание, введение и третья глава
|