В статье рассматриваются способы повышения эффективности
при разработке клиент-серверных СУБД-приложений в среде
VisualBasic 6.0. Наиболее подробно освещены следующие аспекты
проблемы:
- Эффективное использование стандартного для VB
программного интерфейса доступа к данным (ADO);
- Повышение эффективности процесса разработки
СУБД-приложений с использованием стандартных средств, а
также продуктов третьих фирм.
На кого рассчитана статья
Статья рассчитана на широкий круг читателей, меющих дело с
разработкой клиент-серверных СУБД-приложений. рограммисты,
уверенно владеющие VB, но не знакомые с этой областью его
применения, найдут описание эффективных подходов к разработке.
Читатели, не знакомые с VB, смогут составить представление о
плюсах и минусах этого языка как средства разработки
СУБД-приложений. Наконец, опытные VB-программисты, возможно,
найдут в статье пару-тройку неизвестных им приемов.
Описание примеров
В качестве демонстрационного примера мы возьмем серверную
часть гипотетической онлайновой системы обработки транзакций
со счетами в реальном времени (назовем ее «CountDown»).
Предположим, что поток транзакций достаточно велик, и ключевые
таблицы базы данных содержат миллионы записей. Работу системы
контролируют операторы, которым требуется немедленная
статистическая обработка данных. В статье приведен необходимый
минимум исходных текстов; подробные описания стандартных
свойств и методов ищите в MSDN.
Необходимый
инструментарий
Чтобы испытать рассматриваемые приемы на практике,
потребуется Microsoft Visual Basic 6.0 с установленным SP5, а
также Microsoft SQL Server 2000 (там, где речь идет о
серверной части).
Программный интерфейс доступа к данным
Краткая история развития
Самый естественный способ доступа к данным в VB –
COM-объекты. Изначально Microsoft предлагала для VB два вида
технологий доступа к данным:
-
ориентированные на ядро JET (библиотека DAO, Data Access
Objects);
-
ориентированные на источники данных ODBC (библиотека RDO,
Remote Data objects).
Первая категория вообще не имеет отношения к
клиент-серверной архитектуре и рассматривать ее мы не будем.
Что касается RDO, то тут были проблемы, связанные как с
устаревающим интерфейсом ODBC, так и с реализацией самой
библиотеки RDO, как надстройки над ODBC.
Проблемы сняло
появление библиотеки ADO (ActiveX Data Objects), основанной на
новой универсальной технологии доступа к данным OLE DB. Эта
библиотека обладает множеством новых возможностей (таких как
асинхронная работа, поддержка иерархических наборов записей и
пр.) и практически лишена проблем своих предшественниц.
оследняя версия – ADO 2.6, в которой добавлена поддержка
XML.
Библиотека ADO
Архитектура библиотеки, назначение
объектов
Основное назначение библиотеки ADO – операции
с DML (Data Manipulation Language, язык обработки данных). Это
определяет архитектуру библиотеки, ориентированную на
получение наборов данных и их последующую обработку.
Библиотека содержит следующие основные объекты:
-
Connection – соединение с базой даннных;
-
Command – команда DML;
-
Recordset – набор записей;
-
Stream – поток двоичных или текстовых данных;
-
Record – запись.
Рис.1. Объектная модель ADO
Эти объекты предоставляют исчерпывающие возможности для
манипуляций с данными; более того, библиотека позволяет
выполнять одно и то же действие множеством различных способов,
которые могут значительно отличаться по эффективности. Ниже
приведены некоторые рекомендации, которые оптимизировать
некоторые типичные операции.
Соединения
(ADODB.Connection)
Любое действие с данными
производится в контексте какого-либо активного соединения.
Изучение примеров в MSDN может навести на мысль, что для
каждого действия необходимо создать соединение – примерно так:
Sub DoSimpleAction(strActionSQL As
String)
Dim cn As New ADODB.Connection
'
одключаемся к SQL-серверу
cn.Open
"Provider=SQLOLEDB.1;Persist Security Info=False;Data
Source=SomeSQLServer"
' Выполняем запрос
cn.Execute
strActionSQL
'Отключение
cn.Close
End Sub
Однако, для нашей системы «CountDown» критично время
обработки каждой транзакции, поэтому мы не можем каждый раз
тратить время на установку соединения. Вместо этого будем
использовать глобальную объектную переменную типа
ADODB.Connection, которая будет хранить однажды установленное
соединение. А код переделаем так:
Sub DoSimpleAction(cn as
ADODB.Connection, strActionSQL as String)
' Выполняем
запрос
cn.Execute strActionSQL
End Sub
Добавим, что в этом случае желательно:
-
помещать объявление переменной в стандартный модуль,
поскольку данные класса копируются, а это потенциальный
источник «висячих» ссылок и возникновения таинственных
«фантомных» соединений;
-
контролировать корректность соединения, поскольку оно
могло прерваться в процессе работы. Для этого можно
использовать свойство State и событие Disconnect объекта
Connection.
Команды (ADODB.Command)
-
С помощью команд можно получать наборы записей. Команды
могут быть следующих типов:
-
Таблица (adCmdTable) – выбирает все записи из таблицы или
представления;
-
Хранимая процедура (adCmdStoredProc) – вызов хранимой
процедуры, которая возвращает данные;
-
Текст (adCmdText) – произвольный SQL-запрос, возвращающий
данные;
-
Файл (adCmdFile) – получение данных из файла;
-
Неуказанный (adCmdUnspecified).
Общие рекомендации по использованию команд
таковы:
Не используйте команд типа «Текст» или
«Таблица». Вместо этого лучше определить для каждой операции с
данными хранимую процедуру. Выгоды следующие:
-
Если запросы разбросаны по тексту программы – искать и
исправлять ошибки будет значительно сложнее. Если же вы
уверены, что каждая операция выполняется только
соответствующей процедурой – времени на отладку уйдет куда
меньше. Для полной уверенности следует убрать права на
доступ непосредственно к таблицам, назначив вместо этого
права на запуск процедур.
-
Возможность изменения логики программы без
перекомпиляции. Во многих случаях эта стратегия позволит
изменять алгоритмы, или даже структуру данных,
перекомпилировав лишь необходимые хранимые процедуры.
Не используйте представления. С точки зрения
производительности, лучше применять функции, возвращающие
наборы записей. Синтаксис их использования тот же, зато в
ваших руках оказывается вся мощь T-SQL для оптимизации
запросов. Например, в нашей системе требуется немедленное
отображение статистики транзакций на рабочих местах, причем
необходима довольно сложная обработка информации (скажем,
выбрать транзакции по определенному критерию, затем выбрать из
них характерные пары последовательных транзакций, вывести по
ним статистику, и рассортировать счета по результатам). Решить
такую задачу с помощью представлений весьма непросто, решение
будет очень сложным для понимания, кроме того
производительность такого решения будет низкой. С помощью
ункций все намного проще.
Наборы записей
(ADODB.Recordset)
Команды возвращают данные в виде
наборов записей. Наборы бывают:
-
Динамические (adOpenDynamic) – видны все изменения,
вносимые в данные другими пользователями и доступны все
операции, поддерживаемые провайдером данных;
-
Ключевые (adOpenKeyset) – аналогичен динамическому, но не
видны записи, добавляемые другими пользователями;
-
Статические (adOpenStatic) – «снимок» данных; изменения,
вносимые другими пользователями не видны;
-
Однонаправленные (adOpenForwardOnly) – аналогично
статическому, но возможна только прокрутка вперед.
Наборы записей также различаются типом блокировки
(оптимистическая, пессимистическая, пакетная, только для
чтения) и расположением курсора (клиентский или
серверный).
Очевидно, стоит использовать минимальный
подходящий набор возможностей (так, для отчета достаточно
статического набора записей, если вам нужен однократный проход
данных – используйте однонаправленный набор и т.д). Кроме того
– обратите внимание на следующие возможности
ADO:
Пакетное обновление (при поддержке провайдером) –
дает возможность локально внести изменения в несколько записей
набора, и потом передать их на сервер все вместе, «пакетом».
Для этого – вместо метода Update используйте метод
UpdateBatch, установив при этом пакетный тип блокировки
(adLockBatchOptimistic). Это снижает нагрузку на канал
передачи данных, и уменьшает риск сбоя на ненадежном
канале.
Отсоединенные наборы записей. Получив набор
записей с клиентским курсором, можно разорвать соединение с
базой данных, освобождая занятые им ресурсы. При этом набор
записей остается доступным, и соединение в любой момент можно
восстановить для обновления набора или сохранения внесенных
зменений. Делается это следующим образом:
Function
GetDisconnectedRecordset(strSQL As String) As
ADODB.Recordset
Dim cn As New ADODB.Connection
Dim
rstRes As New ADODB.Recordset
' Подключаемся к
SQL-серверу
cn.Open "Provider=SQLOLEDB.1;Persist Security
Info=False;Data Source=SomeSQLServer"
' Открываем набор
записей
rstRes.CursorLocation = adUseClient
rstRes.Open
strQSL, cn, adOpenDynamic,
adLockOptimistic
'Отключение
Set
rstRes.ActiveConnection = Nothing
cn.Close
Set
GetDisconnectedRecordset = rstRes
End Function
Взаимодействие с ODBC
Среди провайдеров данных для OLE DB имеется провайдер для
драйверов ODBC (Microsoft OLE DB Provider for ODBC drivers),
позволяющий подключаться к любым источникам данных ODBC (рис.
2). Следующий совет может показаться тривиальным, но все-таки:
не используйте провайдер данных для ODBC для доступа к СУБД,
если для нее существует «родной» провайдер данных. Как любой
посредник, ODBC утяжеляет каждое обращение к данным; кроме
того, потребуется программно создать сточник данных и следить
за его корректностью. Без всего этого можно обойтись,
используя с ADO «родной» для спользуемой СУБД провайдер
данных. Помните, что основное назначение провайдера для
драйверов ODBC – обеспечить доступ к тем СУБД, для которых еще
не существует OLE DB провайдера.
Рис. 2. Выбор OLE DB провайдера для создания
подключения к СУБД
Применение расширений ADO для работы со схемой данных –
ADOX
Библиотека ADO не содержит средств для
работы со схемой данных. Для анализа или изменения схемы
данных лучше всего воспользоваться библиотекой расширений ADO
– ADOX (ActiveX Data Objects Extensions for Data Definition
Language). Она содержит такие основные объекты как:
-
Catalog – база данных;
-
Table – реляционная таблица;
-
View – представление;
-
Column – столбец;
-
Procedure – хранимая процедура;
-
Index – индекс;
-
Key – первичный, внешний, или альтернативный ключ
таблицы;
-
User – пользователь;
-
Group – группа.
Рис. 3. Объектная модель ADOX
Эти объекты имеют все необходимые методы и свойства для
полноценного управления схемой данных.
Оптимизация процесса разработки
Сейчас мы рассмотрим некоторые дополнительные средства
разработки (как входящие в состав VB, так и внешние),
грамотное использование которых повысит общую эффективность
труда программиста.
Применение
DataEnvironment
DataEnvironment – стандартный
ActiveX-дизайнер, входящий в состав VB. При правильном
спользовании он позволяет радикально упростить процесс
создания СУБД-приложения, однако многие VB-программисты, даже
меющие опыт работы с базами данных, не вполне представляют
себе его возможности. Для начала – добавим его к проекту
(контекстное меню проекта в окне Project Explorer, см. рис.
4).
Рис. 4. Добавление DataEnvironment к проекту
В папке Designers проекта появится элемент с названием
DataEnvironment1 (которое можно впоследствии зменить), а в
программе – одноименный глобальный объект. режде, чем мы
воспользуемся новым элементом – нужно создать все необходимые
для работы приложения соединения. Теперь рассмотрим некоторые
способы его применения:
Используйте конструктор
DataEnvironment для создания команд. Если вы прислушались
к совету собрать все операции с данными в хранимых процедурах
– у вас может возникнуть вопрос: большое приложение имеет
десятки и сотни подобных команд; неужели придется вручную
описывать их все на VB? Тут пригодится DataEnvironment. Чтобы
создать команду для вызова хранимой процедуры – просто
перетащите процедуру мышью з окна Data View в окно
конструктора DataEnvironment. Для каждой созданной подобным
образом команды создается метод объекта DataEnvironment,
аргументы которого соответствуют параметрам хранимой
процедуры. Поясним на примере: если вы объявили процедеру,
как:
CREATE PROC SomeProcWithManyParams
@param1
int,
@param2 varchar(255),
@param3
float
AS
.....
END
и перетащили ее как сказано
выше – у объекта DataEnvironment автоматически появляется
метод:
SomeProcWithManyParams(param1 As Long, param2 As
String, param3 as Double)
Далее для выполнения команды
с необходимыми значениями параметров можно (и нужно)
пользоваться именно этим методом. Кстати, подобные методы
также создаются для команд типа «запрос SQL», однако в этом
случае их аргументы, соответствующие параметрам запроса,
придется доопределить вручную.
Результат подобных
действий выглядит примерно так, как показано на рис.
5.
Рис. 5. Набор команд, созданный в конструкторе
DataEnvironment
Используйте конструктор DataEnvironment для создания
иерархических команд. Иерархические команды в сочетании со
стандартным элементом MSHFlexGrid позволяют отображать
иерархические данные в весьма удобной форме. DataEnvironment
позволяет очень легко создавать иерархические команды,
устанавливая связи по значениям одного или нескольких полей.
Воспользуйтесь вкладкой «Relation» окна свойств команды, где
можно указать родительскую команду и перечислить поля для
связи. Хотя так можно установить только простейшую связь, все
равно описанный способ полезен – ведь этот случай является
наиболее типичным.
Используйте окно кода
DataEnvironment для обработки событий, возникающих при работе
с данными. Каждая команда, созданная в DataEnvironment
является экземпляром класса Command; соответственно
обработчики всех событий этого класса можно писать в окне кода
DataEnvironment. Кроме этого, каждая команда, возвращающая
набор данных, порождает дополнительный объект класса
Recordset, имя которого получается добавлением префикса «rs» к
имени команды. Эти объекты плюс экземпляр класса Connection,
который соответствует соединению с базой данных, дают нам
полный контроль над событиями, связанными с получением и
изменением данных, а также над навигацией по ним. А значит –
всю логику работы клиентской части приложения с данными мы
можем описать именно здесь, в одном месте программы, облегчая
ее понимание и поиск ошибок. Например, здесь можно связать
событие перемещения по записям родительского набора записей
(master) c обновлением дочернего набора записей (detail). Этот
механизм будет автоматически срабатывать в любом участке
программы, повлекшим навигацию, что избавляет нас от
дублирования кода, которое могло бы возникнуть, свяжи мы
подобную логику, например, с визуальными элементами
управления.
Будьте внимательны при обновлении
отображаемых наборов записей с помощью DataEnvironment.
Существует одна проблема, которая, хоть и документирована,
вызывает головную боль у тех, кто документацию не читает. Суть
в следующем – если вы обновите набор записей объекта
DataEnvironment, который является сточником данных для
визуального элемента управления, необходимо заново выполнить
привязку этого элемента управления к данным, иначе обновление
в нем не отразится. Пример:
' Обновляем набор
записей
deMain.rsAccounts.Requery
' Необходимо привязать
грид заново для отображения новых данных
With
grdAccounts
.DataMember = "Accounts"
Set .DataSource =
deMain
End With
Применение CASE-средств (Visual Modeler, Rational
Rose)
Разработку сложных приложений с развитой логикой
и богатой объектной моделью на VB может существенно упростить
и ускорить применение объектно-ориентированных CASE-средств.
Конкретные преимущества такие:
-
Автоматизация процесса проектирования (создания объектных
моделей);
-
Автоматическая генерация заготовок исходного кода по
объектной модели;
-
Автоматический реинжиниринг кода (создание объектной
модели по коду);
-
Автоматизация процесса создания документации.
Все это в полной мере применимо к разработке сложных
СУБД-приложений. Мы не будем излагать основы работы с
CASE-средствами, и ограничимся сравнением возможностей двух
подобных инструментов, интегрированных с VB, субъективно
оценив их возможности по пятибалльной шкале:
|
Visual Modeler |
Rational Rose |
Моделирование |
3 |
5 |
Генерация кода |
4 |
5 |
Реинжиниринг |
3 |
5 |
Документирование |
2 |
5 |
Применение профайлеров (SQL-Profiler, Rational
Quantify)
Создание эффективных приложений невозможно
без поиска и анализа «узких мест» в коде. Анализ
УБД-приложений имеет свою специфику: как правило, время
выполнения разделено между программой и СУБД. Допустим,
тестирование выявило в системе «CountDown» проблему –
недостаточную производительность при большом числе клиентов.
Где искать «узкое место» – в коде на VB или в хранимых
процедурах? Решить проблему помогут специальные средства,
предназначенные для локализации проблем производительности –
профайлеры.
Rational Quantify. Этот инструмент
позволяет получить детальную информацию о работе
VB-приложения. В процессе контрольного выполнения собирается
статистика о числе вызовов, среднем и суммарном времени
выполнения каждой процедуры и даже строки программы. Если
окажется, что производительность тормозят определенные
хранимые процедуры – надо оптимизировать их. Если же
относительная доля временных затрат на подобные вызовы
невелика, дальнейший анализ статистики, собранной Rational
Quantify подскажет, где искать «узкое место» в VB-коде.
SQL-Profiler. Это средство позволяет анализировать
процесс взаимодействия любого приложения с MS SQL Server.
Допустим, вы работаете с чужой программой, и у вас есть
подозрение, что она работает с СУБД неоптимально, однако
непонятны причины и условия, в которых это происходит. В этом
случае пригодится SQL-profiler. Он позволяет получить
подробную информацию о каждом обращении приложения к СУБД,
вплоть до трассировки выполнения хранимых процедур. Если
где-то делается неэффективный запрос, то он будет виден в
протоколе работы как на ладони, причем в контексте предыдущих
последующих вызовов, что в большинстве случаев позволяет
обнаружить причину «торможения» программы.
Краткое резюме
На этом мы остановимся. К сожалению, ограничения
журнального формата не позволяют затронуть в этой статье такие
интересные темы как:
-
Разработка собственных источников данных;
-
Создание эффективного интерфейса пользователя;
-
Реализация OLAP средствами VB.
Возможно, они будут освещены в следующей статье.
В
заключение: редакция требует от автора сказать свое слово в
споре сторонников и противников VB как средства разработки
СУБД-приложений. Что ж, попробуем перечислить сильные и слабые
стороны VB в этом отношении, и указать область его применения.
Итак, к основным плюсам VB можно отнести:
-
Наличие мощного объектного API-доступа к данным;
-
Наличие визуального конструктора объектов доступа к
данным;
-
Мощные средства создания интерфейса пользователя;
-
Простоту отладки приложений;
-
Интеграцию с CASE-средствами.
Среди минусов я бы выделил два:
-
Обманчивая простота VB. VB действительно позволяет
новичку сделать нечто, похожее на работающую программу.
Однако необходимо понимать, что на самом деле VB –
достаточно сложный инструмент, для адекватного применения
которого требуется серьезный опыт. Иначе разочарования
неизбежны ;)
-
Наличие некоторого количества неприятных багов в самых,
казалось бы, ровных местах. Хотя они, по большей части,
документированы, однако, не все из них имеют простые
обходные пути, что создает дополнительный барьер на пути
написания сложных приложений…
Резюмируя: VB дает возможность чрезвычайно быстро
разрабатывать и тестировать эффективные УБД-приложения,
относящиеся как к front-end, так и к back-end. Единственное
необходимое условие – мастерство программиста.