Корпоративные хранилища данных. Том 1.
Планирование, разработка, реализация

Издательство: Издательский дом "Вильямс", 2001   |   ISBN 10: 5-8459-0191-x  |  ISBN 13:   |
Автор(ы): Eric Sperley


крупнее

Реальные механизмы, приводящие в действие хранилище данных!

Наконец-то конкретно! Это не теоретическая книга, а рабочее пошаговое руководство по созданию хранилища данных, способного удовлетворить информационные потребности вашего бизнеса. Начиная с метода совместной разработки приложений (JAD), создающего кумулятивный эффект в разработке, и заканчивая оптимальным выбором технического и программного обеспечения и средств работы конечного пользователя, Эрик Спирли предлагает проверенные методы, на которые можно положиться. В книге освещены следующие вопросы.

  • Моделирование корпоративных данных, включая такие подходы, как оперативные ER-модели и аналитические схемы типа «звезда»
  • Архитектура хранилища данных: роли, альтернативы, компромиссы
  • Конструирование репозитория метаданных, способного «пролить свет» на имеющиеся ресурсы данных
  • Повышение качества данных (при этом основы существующей системы остаются незыблемыми)
  • Тонкие методы добычи данных: генетические алгоритмы, нейронные сети, кластеризация, деревья решений и т. д.
  • Планирование развития хранилищ данных, обеспечивающее масштабируемость и легкость их обновления

Спирли (Eric Sperly) предлагает практическую, ориентированную бизнес-процессы методологию, достаточно гибкую для любого предприятия и настолько подробную, что у вас никогда не возникнет сомнения по поводу дальнейших действий.


Автор текста: Игорь Бралгин

Одна из немногочисленных книг по проблемам хранилищ данных, изданных на русском языке, однозначно заслуживает прочтения специалистами, имеющими отношение к построению хранилищ данных.

Не смотря на небольшой объем, книга «Корпоративные хранилища данных» дает достаточно ёмкое освещение вопросов, связанных с построением хранилищ данных, и с возникающими при этом трудностями и проблемами.

Начав с истории возникновения хранилищ данных, автор последовательно знакомит читателя с такими вопросами как:

  • Концепция и методология построения хранилищ данных;
  • Увязка бизнеса и ИТ;
  • Предметные области и рамки проекта;
  • Моделирование данных;
  • Метаданные и их классификация;
  • Концептуальная, логическая и физическая архитектура хранилища данных;
  • Доступ к данным и различные типы потребителей информации;
  • Добыча данных (data mining).

По прочтении книги «Корпоративные хранилища данных. Планирование, разработка и реализация» остается два нерешенных вопроса:

  • Где взять второй том?
  • Почему при наличии такой книги так много проблем и противоречий преследуют проекты по созданию хранилищ данных?

На вопрос о продолжении книги «Корпоративные хранилища данных» чаще всего можно услышать ответ, что второго тома не существует (ваш покорный слуга, тоже в прошлом грешил этим). То же самое при беглом просмотре подтверждают и поисковые системы. Однако, более тщательные исследования, делают отрицательный ответ не столь убедительным, и наводят пытливого искателя продолжения книги Эрика Спирли (Eric Sperley) на мысли о мистической судьбе второго тома.

Существуют сведения, что книга «Корпоративные хранилища данных. Том 2. Реализация, поддержка и расширение» («Enterprise Data Warehouse Volume 2: Implementation, Maintenance, and Extensions»; ISBN-10: 0-13-905852-4; ISBN-13: 978-0-13-905852-3) все же была выпущена издательством Prentice Hall в декабре 2002 года (или в январе 2003). Мистикой же является то, что при бешенной популярности во всем мире первого тома, о втором томе ни в одном книжном Интернет магазине нет даже упоминания о ней в каталогах и в отзывах, и тем более нет самой книги. Единственное предложение о продаже 2-го тома мне удалось найти на сайте netstoreusa.com.

Попытка разобраться со вторым вопросом, так же ясности не добавляет. Рекомендуя к прочтению «Корпоративные хранилища данных. Планирование, разработка и реализация» и ссылаясь на материалы из книги в обсуждениях различных проблем построения хранилищ данных, я с удивлением узнавал, что практически у каждого вовлеченного в дискуссию эта книга есть. И большинство, давая высокую оценку книге, уверяли, что читали ее…

Однако большое количество проблем при создании хранилищ данных наводит на мысли, либо о невнимательном чтении книги «Корпоративные хранилища данных», либо о том, что любовь и тяга к изобретению велосипедов перевешивают здравый смысл и возможность использовать чужой опыт.

Ну и в заключении хочется озвучить вопрос, не имеющий отношения к книге, но общего плана, к нашим многочисленным издателям: Почему так мало книг, посвященных хранилищам данных, издается на русском языке?


Оглавление книги «Корпоративные хранилища данных. Том 1. Планирование, разработка, реализация»

Глава 1. Информационная технология и концепция хранилища данных

1.1.    Введение
1.2.    Краткая история информационных технологий
1.2.1. Информационные "бункеры" организаций
1.3.    Что такое хранилище данных
1.4.    Навстречу требованиям бизнеса
1.5.    Корпоративная модель данных
1.6.    Схема методологии: замысел, пилотный проект, изготовление системы
1.6.1. Спиральная модель процесса разработки
1.6.2. Методология быстрой разработки приложений
1.7.    Архитектура хранилища данных
1.8.    Доступ потребителей к информации
Вопросы
Упражнения

Глава 2. Увязка бизнеса и ИТ через хранилища данных

2.1.    Введение
2.2.    Наставление по разработке
2.3.    Реинжиниринг бизнес - процессов
2.4.    Увязка бизнеса и ИТ
2.4.1. Позиционная оценка
2.4.2. Позиция, касающаяся потенциальных возможностей
2.4.3. Ситуационная оценка
2.4.4. Оценка цепочки ценности
2.5.    Гибкое ИТ - подразделение
2.6.    Открытые системы
2.7.    Критерий перехода к открытым системам и хранилищам данных
2.8.    Управление ИТ - обслуживанием
Вопросы
Упражнения

Глава 3. Планирование и построение хранилища данных

3.1. Введение
3.2. Анализ потребностей бизнеса
3.3. Оценка готовности ИТ - подразделения
3.4. Выбор проекта
3.5. Концептуальная архитектура хранилища
3.6. Логическая архитектура хранилища
3.7. Физическая архитектура хранилища
3.8. Архитектура данных
3.9. Реализация
Вопросы
Упражнения

Глава 4. Предметная область и рамки проекта

4.1.    Введение
4.2.    Выявление деловых требований: интервью с руководителями
4.3.    Определение функциональных требований: JAD - совещание
4.4.    Определение рамок проекта
4.5.    Планирование
4.5.1. Определение проекта
4.5.2. Планирование проекта
4.5.3. Управление проектом
4.6.    Состав и специализация проектной бригады
Вопросы
Упражнения

Глава 5. Моделирование данных

5.1.    Введение
5.1.1. Сущности
5.2.    Корпоративная модель данных
5.2.1. Корпоративная модель данных: принцип разумной достаточности
5.3.    Анализ схемы типа "звезда": создание размерностной модели
5.3.1. Методы разработки модели
5.3.2. Уровень детализации
5.3.3. Время
5.3.4. События
5.4.    Разработка размерностной модели
5.5.    Схема типа "снежинка"
5.6.    Физическое моделирование
5.7.    "Десять заповедей" построения размерностей модели данных
5.8.    Две грани пирамиды: ER - модель и схема типа "звезда"
Вопросы
Упражнения

Глава 6. Репозиторий метаданных

6.1.    Введение: что такое метаданные
6.2.    Модель использования метаданных
6.2.1. Проектные метаданные
6.2.2. Активные рабочие метаданные
6.2.3. Пассивные рабочие метаданные
6.3.    Размерностная модель метаданных
6.3.1. Метаданные, описывающие действия над данными
6.3.2. Метаданные, описывающие местоположение ресурсов системы хранилища данных
6.3.3. Метаданные, описывающие сущности
6.3.4. Метаданные, описывающие взаимодействие людей с хранилищем данных
6.3.5. Метаданные, описывающие движущие силы проекта хранилища данных
6.3.6. Метаданные, описывающие временные аспекты функционирования хранилища данных
6.3.7. Сбор и сопровождение метаданных
6.3.8. Создание начальных метаданных
6.3.9. Большие хранилища, или метаданные многопредметных областей
6.4.    Справочник пользователя информации
Вопросы
Упражнения

Глава 7. Повышение качества информации в хранилищах данных

7.1. Введение
7.2. Значение качества информации для успеха организации
7.3. Трудности на пути получения качественных данных
7.4. Методы оценки выгод, получаемых за счет обеспечения высокого качества данных
7.5. За какое качество мы должны бороться
7.6. Методы оценки данных
7.7. Программные средства оценки качества данных
7.8. Оценка данных, или аудит
Вопросы
Упражнения

Глава 8. Концептуальная и логическая архитектура хранилища данных

8.1.    Введение
8.2.    Почему принципы так важны
8.3.    Метапринципы: принципы о принципах
8.4.    Архитектурные принципы
8.4.1. Общие принципы
8.4.2. Принципы построения данных
8.4.3. Принципы построения запросов
8.4.4. Принципы построения рабочих хранилищ
8.4.5. Принципы построения метаданных
8.4.6. Принципы масштабируемости
8.4.7. Принципы управления хранилищем
8.4.8. Архитектурные принципы и концепция Захмана
8.4.9. Резюме
8.5.    Концептуальные модели
8.5.1. Неуправляемое развитие СППР
8.5.2. Виртуальное хранилище данных
8.5.3. Семантическая интеграция предметных областей
8.5.4. Управление запросами к предметным областям
8.5.5. Монолитное хранилище
8.5.6. Стандартный архив данных
8.6.    Выбор архитектуры
8.6.1. Неуправляемое развитие СППР
8.6.2. Виртуальное хранилище данных
8.6.3. Семантическая интеграция предметных областей
8.6.4. Управление запросами к предметным областям
8.6.5. Монолитное хранилище
8.6.6. Стандартный архив данных
8.7.    Логические модели
Вопросы
Упражнения

Глава 9. Физическая архитектура хранилища данных

9.1.    Введение
9.2.    Физическая память
9.3.    Базы данных
9.4.    Аппаратное обеспечение сервера баз данных
9.5.    Операционные системы
9.5.1. Производительность
9.5.2. Устойчивость
9.5.3. Интеграция
9.5.4. Безопасность
9.5.5. Управляемость
9.6.    Сервер запросов и сервер приложений
9.7.    Сети и средства взаимодействия
9.8.    Программное обеспечение промежуточного уровня
9.8.1. Пакет Usage Tracker
9.8.2. Пакет Platinum Repository
9.8.3. Мониторы обработки транзакций
9.8.4. Выбор ПО промежуточного уровня
9.9.    Рабочие станции специалистов в области инженерных знаний
9.10.    Развертывание архитектуры
Вопросы
Упражнения

Глава 10. Преобразование данных

10.1. Введение
10.2. Планирование
10.3. Методы извлечения и перемещения данных
10.4. Преобразование данных
10.5. Загрузка данных
Вопросы
Упражнения

Глава 11. Доступ к данным

11.1.    Введение
11.2.    Выбор средств доступа к данным
11.2.1. Типы потребителей информации
11.2.2. Все эти OLAP, MOLAP, ROLAP
11.2.3. Критерий выбора поставщика
11.3.    Распределение информации
11.4.    Доступ с помощью Web
11.5.    Электронные таблицы
11.6.    Средства визуализации
11.7.    Средства создания запросов
11.7.1. Технические функции
11.7.2. Функции управления запросами
11.7.3. Функции представления данных
11.7.4. Функции интерфейса
11.8.    Программные средства СППР
11.8.1. Управление запросами
11.9.    Знакомство с методами добычи данных
Вопросы
Упражнения

Глава 12. Добыча данных

12.1.    Введение
12.2.    Подготовка данных
12.3.    Нейронные сети
12.4.    Генетический алгоритм
12.5.    Кластеризация и классификация
12.6.    Деревья решений
12.7.    Статистические методы
12.7.1. Регрессионная модель
12.7.2. Дискриминантный анализ
12.8.    Программные продукты, реализующие методы добычи данных
12.9.    Пример ПО добычи данных
Вопросы
Упражнения

Глоссарий

Список рекомендованной литературы

Список использованной литературы

Предметный указатель


Предлагаем Вашему вниманию отрывки из книги «Корпоративные хранилища данных. Планирование, разработка, реализация»:

Напоминаем, что авторские права охраняются законом и данные материалы предоставлены исключительно в ознакомительных целях!