Производительность удаленного хранилища больших двоичных объектов SQL Server при использовании с SharePoint Server 2010 и решением для хранения StorSimple Этот документ предоставляется на условиях «как есть». Сведения и изображения, представленные в данном документе, включая URL-адреса и другие ссылки на веб-сайты в Интернете, могут изменяться без уведомления. Риск, связанный с использованием таких сведений, лежит на вас. Данный документ не предоставляет вам юридических прав на интеллектуальную собственность в отношении каких-либо продуктов Майкрософт. Разрешается копирование и использование данного документа для внутренних справочных целей. Изменение этого документа для внутренних или справочных целей запрещено. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Microsoft SharePoint Server 2010 Апрель 2011 г. Производительность удаленного хранилища больших двоичных объектов SQL Server при использовании с SharePoint Server 2010 и решением для хранения StorSimple Бурзин Пател (Burzin Patel) StorSimple, Inc. Питер Шарлок (Peter Scharlock) Корпорация Майкрософт Технические редакторы: Джон Флорес (John Flores) из компании StorSimple, Inc., Срини Ачари (Srini Acharya), Стив Говард (Steve Howard), Шон Тинлайн-Джонс (Shaun Tinline-Jones), Майк Вейнер (Mike Weiner), Кунь Чен (Kun Cheng), Прем Мейра (Prem Mehra), Джимми Мэй (Jimmy May), Дэвид Коронтали (David Koronthaly), Бил Баер (Bill Baer) Декабрь 2010 г.; пересмотрено в апреле 2011 г. Область применения: SharePoint Server 2010 и SQL Server 2008 R2 Сводка. Технология Microsoft® SharePoint® за последние годы стала намного более популярной. Такой рост популярности был вызван тем, что пользователи стали хранить все больше документов в библиотеках SharePoint, а также сохранять более крупные мультимедийные документы. В итоге это привело к росту затрат на хранение, а также к появления некоторых проблем с производительностью и управляемостью у администраторов SharePoint. Корпорация Майкрософт решила данные проблемы, реализовав в SharePoint Server 2010 собственную поддержку компонента удаленного хранилища больших двоичных объектов (RBS). В данном документе описывается использование компонента удаленного хранилища больших двоичных объектов в SharePoint Server 2010 и анализируется его влияние на производительность ключевых атрибутов фермы SharePoint, таких как размер базы данных, размер резервной копии базы данных, время ответа транзакции и время резервного копирования/восстановления. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 2 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Содержание Введение ..........................................................................................................................................................4 Удаленное хранилище больших двоичных объектов ............................................................................................4 Причины для использования удаленного хранилища больших двоичных объектов ..........................................5 Цели тестирования ............................................................................................................................................6 Методика тестирования .....................................................................................................................................7 Рабочая нагрузка ........................................................................................................................................7 Конфигурация сервера ................................................................................................................................9 Конфигурация оборудования.................................................................................................................9 Конфигурация хранилища ................................................................................................................... 10 Конфигурация программного обеспечения ........................................................................................... 10 Результаты тестирования и наблюдения ........................................................................................................... 11 1. Влияние удаленного хранилища больших двоичных объектов на размер базы данных SQL Server ............. 12 2. Влияние удаленного хранилища больших двоичных объектов на размер резервной копии базы данных ........... 14 3. Влияние удаленного хранилища больших двоичных объектов на время резервного копирования и восстановления ........................................................................................................................................ 17 4. Влияние удаленного хранилища больших двоичных объектов на производительность перестроения индексов .................................................................................................................................................. 19 5. Влияние удаленного хранилища больших двоичных объектов на время ответа транзакции SharePoint ....... 21 6. Влияние удаленного хранилища больших двоичных объектов на производительность обхода .................... 24 7. Влияние удаленного хранилища больших двоичных объектов на производительность отправки файлов..... 25 8. Время, требуемое на перенос данных ..................................................................................................... 27 Заключение .................................................................................................................................................... 28 Дополнительные ресурсы ................................................................................................................................ 29 Сведения о StorSimple ..................................................................................................................................... 29 Сведения о корпорации Майкрософт ................................................................................................................ 29 © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 3 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Введение За последние несколько лет популярность Microsoft SharePoint Server возрастала практически экспоненциально. Этот рост был вызван тем, что все больше клиентов внедряло SharePoint Server и все больше пользователей сохраняло крупные документы и наборы данных в фермах SharePoint. После недавнего выпуска SharePoint Server 2010 прогнозируется дальнейшее увеличение такого роста использования. SharePoint Server 2010 предоставляет более рациональный пользовательский интерфейс, который обеспечивает более полное взаимодействие с пользователем, что делает SharePoint Server предпочтительным репозиторием для всех типов данных. Увеличение размера мультимедийного контента вызывает чрезмерное увеличение размера фермы SharePoint, что в свою очередь вызывает значительное увеличение требуемого места на физическом носителе. Такое увеличение размеров часто создает трудности для администраторов SharePoint, которым приходится тратить дополнительное время на управление возросшим объемом контента, более крупными базами данных и резервными копиями. Чтобы решить все эти проблемы, в SharePoint Server 2010 представлен новый компонент — удаленное хранилище больших двоичных объектов, которое помогает устранить проблемы, вызванные увеличением размера контента SharePoint. В данном документе рассматриваются преимущества и рабочие характеристики компонента удаленного хранилища больших двоичных объектов при его использовании с Microsoft SharePoint Server 2010. Кроме того, здесь приведены рабочие характеристики производительности фермы SharePoint, настроенной на работу с решением для хранения StorSimple, как пояснено в следующем разделе. Такие преимущества, как уменьшение размера базы данных, ускорение резервного копирования и восстановления баз данных, улучшение времени ответа для крупных документов, упрощение обслуживания баз данных и меньшая загруженность внутреннего хранилища, будут рассмотрены вместе с соответствующими точками данных производительности. Все точки данных, представленные в этом документе, были созданы в рамках тестирования производительности, проведенного в лабораториях компании StorSimple, Inc. в городе Санта Клара при содействии групп разработчиков Microsoft SQL Server и SharePoint. Примечание. Приведенные в настоящем документе результаты тестирования характерны для описанной здесь среды. Результаты для вашей среды могут быть иными. Удаленное хранилище больших двоичных объектов Для обозначения понятия «большой двоичный объект» используется акроним BLOB. В контексте приложения SharePoint это понятие относится к объекту файла, который хранился в базе данных. Удаленное хранилище больших двоичных объектов — это набор API библиотек Microsoft® SQL Server®, который реализован в виде пакета дополнительных компонентов для Microsoft SQL Server 2008 R2. Компонент удаленного хранилища больших двоичных объектов позволяет приложениям вынести хранение больших двоичных объектов в расположение за пределами базы данных, например в общую папку, что приводит к снижению требуемого места в базе данных SQL Server. Удаленное хранилище больших двоичных объектов обычно представляет собой отдельный том в одной сети с SQL Server. SharePoint Server 2010 использует компонент удаленного хранилища больших двоичных объектов для выноса больших двоичных объектов, хранящихся в базе данных контента. SQL Server и SharePoint Server совместно управляют целостностью данных в записях баз данных и внешним удаленным хранилищем больших двоичных объектов для каждой базы данных в отдельности. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 4 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Компонент удаленного хранилища больших двоичных объектов SQL Server требует установки поставщика на каждом интерфейсном веб-сервере SharePoint, на котором настроено приложение SharePoint. Этот поставщик состоит из набора библиотек DLL, которые реализуют методы для API удаленного хранилища больших двоичных объектов и выполняют непосредственную обработку выноса больших двоичных объектов. Для всех описанных здесь тестов на ферме SharePoint Server 2010 был настроен продукт StorSimple SharePoint Database Optimizer, в состав которого входит поставщик удаленного хранилища больших двоичных объектов. Эта настройка была выполнена с помощью диспетчера конфигурации удаленного хранилища больших двоичных объектов StorSimple SharePoint Database Optimizer, который представляет собой расширение для сайта центра администрирования, как показано на приведенном ниже рисунке (i). Рис. (i). StorSimple SharePoint Database Optimizer — конфигурация удаленного хранилища больших двоичных объектов Причины для использования удаленного хранилища больших двоичных объектов SharePoint Server сохраняет все данные в базе данных. По мере увеличение объема хранимых данных размер базы данных может расти очень быстро. Этот рост вызван новым контентом, отправляемым в SharePoint Server, а также исправлениями существующего контента при включенном управлении версиями SharePoint. При изменении даже одного байта в документе SharePoint в базе данных сохраняется новая копия всего большого двоичного объекта, а предыдущая копия помечается как © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 5 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. устаревшая. Как уже заметили многие администраторы SharePoint, все это приводит к экспоненциальному росту размера контента. По мере роста размера базы данных становится очень сложно управлять системой и обеспечивать оптимальный уровень производительности. Кроме того, выполнение таких базовых задач, как резервное копирование и восстановление, а также дефрагментация баз данных, становится все труднее. Это одна из причин, по которым корпорация Майкрософт рекомендует клиентам ограничить размер своих баз данных до разумного значения, как объяснено в статье: «Управление емкостью SharePoint Server 2010: пределы и ограничения программного обеспечения» (http://technet.microsoft.com/ru-ru/library/cc262787.aspx#ContentDB). Соблюдение этой рекомендации означает, что администраторы SharePoint вынуждены создавать несколько баз данных, что вызывает рост расходов на управление и обслуживание. Увеличение числа баз данных ведет к росту числа резервных копий, которые необходимо контролировать и отслеживать, что в свою очередь требует больше администраторов SharePoint. Используя удаленное хранилище больших двоичных объектов, ваше приложение может сохранять большие объемы неструктурированных данных, таких как мультимедийные видео- или аудиофайлы, с помощью реляционных возможностей SQL Server и масштабируемости хранилища больших двоичных объектов файловой системы Windows®. Кроме этого основного преимущества, компонент удаленного хранилища больших двоичных объектов также предоставляет множество других преимуществ, связанных с затратами на хранение, пригодностью к обслуживанию, производительностью и гибкостью: Уменьшенный размер баз данных, который обеспечивает оптимальное использование дорогостоящих ресурсов сервера базы данных, таких как процессоры, память и диски. Уменьшенный размер файлов резервных копий баз данных. Ускорение резервного копирования и восстановления. Ускорение выполнения операций обслуживания баз данных, таких как дефрагментация и перестроение индекса. Повышение общей производительности, особенно, при сохранении больших объектов и при доступе к ним. Когда продукт SharePoint Server настроен использование удаленного хранилища больших двоичных объектов, семантика транзакций для пользовательских операций полностью сохраняется, а какие либо изменения в работе с точки зрения конечного пользователя отсутствуют. Задача по вынесению больших двоичных объектов за пределы базы данных выполняется автоматически на серверной части продуктом SharePoint Server совместно с поставщиком удаленного хранилища больших двоичных объектов. Удаленное хранилище больших двоичных объектов полностью интегрировано с отказоустойчивой кластеризацией SQL Server, однако оно не работает с зеркальным отображением SQL Server, когда база данных контента SharePoint зеркально отображается на сервер базы данных в другой ферме. Цели тестирования Цель нашего тестирования заключалась в том, чтобы дать характеристику производительности фермы SharePoint, настроенной для использования удаленного хранилища больших двоичных объектов с помощью поставщика удаленного хранилища больших двоичных объектов StorSimple, который входит в состав StorSimple SharePoint Database Optimizer, а также в сравнении этой производительности с производительностью фермы SharePoint без включенного компонента удаленного хранилища больших двоичных объектов. Мы также хотели измерить воздействие удаленного хранилища больших двоичных объектов на следующие аспекты: © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 6 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Размеры файлов базы данных SQL Server и журнала транзакций Размер файла резервной копии Время, затрачиваемое на резервное копирование и восстановление базы данных контента Время, затрачиваемое на перестроение индексов базы данных контента Влияние операции перестроения индексов на производительность транзакций конечных пользователей Время ответа транзакции SharePoint Операция обхода контента при поиске SharePoint Server Производительность отправки файла Согласованность производительности при увеличении объема контента Время, затрачиваемое на перенос данных в удаленное хранилище больших двоичных объектов и из него Рассмотрение поведения SharePoint Server 2010 при изменении характеристик рабочей нагрузки приложений или при изменении пороговых значений для размера выносимых больших двоичных объектов, выходит за рамки данного документа. Методика тестирования Нашей целью было проведение тестов, описанных в предыдущем разделе, для рабочей нагрузки, как можно более точно отражающей реальные рабочие сценарии. Другой целью было сохранение относительного постоянства условий (конфигурация сервера, параметры баз данных, схема таблицы и т. д.) тестов, чтобы мы могли сравнить производительность при выполнении различных операций. Тесты были поделены на 3 большие категории: (1) тест отправки, (2) тест набора полных транзакций и (3) тест иных операций. Тест отправки документов: Этот набор тестов измерял производительность и влияние удаленного хранилища больших двоичных объектов при отправке пользовательских документов с переменным средним размером файла. Тест набора полных транзакций SharePoint: Этот набор тестов измерял влияние удаленного хранилища больших двоичных объектов на производительность фермы SharePoint. Эти тесты включали в себя все распространенные пользовательские транзакции SharePoint, такие как просмотр, поиск, отправка документа и создание сайта. Основной метрикой производительности было среднее время ответа веб-страниц. Тесты иных операций: Эти тесты включали в себя такие операции, как резервное копирование и восстановление баз данных, перенос объектов в базу данных и из нее и в удаленное хранилище больших двоичных объектов, а также обхода контента при поиске SharePoint Server. Рабочая нагрузка Разнообразие вопросов, на которые мы хотели ответить с помощью тестирования, вынудило нас использовать различные наборы данных для рабочей нагрузки. Для тестов использовались две рабочие нагрузки: (1) набор рабочей нагрузки для отправки файлов и (2) набор рабочей нагрузки для полных транзакций SharePoint. Набор рабочей нагрузки для отправки файлов, включавший в себя два набора файлов: набор со средневзвешенным размером около 100 КБ использовался для создания базы данных размером 100 ГБ, а с размером 500 КБ — для создания базы данных контента 1 ТБ. Распределение размера файлов для набора размером 100 КБ приведено на рисунке (ii). © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 7 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Рис. (ii). Распределение размера файлов рабочей нагрузки Набор рабочей нагрузки для отправки файлов использовался в основном для измерения характеристик отправки документов с включенным и выключенным удаленным хранилищем больших двоичных объектов. Набор рабочей нагрузки для полных транзакций SharePoint использовался для представления набора типичных транзакций SharePoint, которые конечный пользователь выполняет ежедневно. Microsoft Visual Studio® Team System 2008 Team Suite использовался для создания рабочей нагрузки с помощью модифицированной версии исходного набора средств по обеспечению производительности Microsoft Office SharePoint Server 2007, предоставленного для совместного доступа на веб-сайте Codeplex. Для каждого из тестов использовались указанные ниже транзакции. Имя теста Описание Процент Рабочий процесс для страниц Прохождение через рабочий процесс для страниц: извлечь, утвердить и вернуть 1% Создание страницы Создание новой страницы 6% Диспетчер сайтов Открытие представления диспетчера сайтов 1% Создание сайта публикации Создание нового сайта с шаблоном публикации 1% Создание сайта группы Создание нового семейства веб-сайтов с помощью шаблона сайт группы в каталоге сайтов 1% © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 8 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Домашняя страница Переход на домашнюю страницу портала 25% Большая страница Переход на различные страницы в рамках портала 10% Общедоступная страница личного сайта Переход на общедоступную страницу личного сайта 16% Профиль изменения личного сайта Изменение личного профиля 7% Запрос поиска Выполнение запроса поиска и просмотр результатов на странице центра поиска 15% Отправка документа Отправка документа (средний размер — 90 КБ) 5% Загрузка документа Загрузка документа (средний размер — 90 КБ) 12% Итого: 100% Табл. (i). Набор полных транзакций SharePoint Конфигурация сервера Ферма SharePoint была настроена на использование шести интерфейсных веб-серверов, одного сервера приложений, который был настроен на запуск программы-обходчика для поиска, и одного сервера базы данных, как показано на рисунке (iii). Рис. (iii). Топология фермы SharePoint Интерфейсные веб-серверы и сервер приложений были настроены для работы в виртуальной машине, а сервер базы данных работал на выделенном физическом (невиртуализованном) сервере. Кроме того, использовались шесть основанных на виртуальных машинах нагрузочных серверов (которые не показаны выше), создающих рабочую нагрузку для набора транзакций по отправке файла и для набора полных транзакций SharePoint. Конфигурация оборудования Роль компьютера Оборудование Интерфейсные веб- 2 процессора Intel Xeon E5504 с частотой 2 ГГц © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 9 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 серверы Апрель 2011 г. (виртуализованные) 8 ГБ ОЗУ Сервер приложений 2 процессора Intel Xeon с частотой 2 ГГц (виртуализованные) 8 ГБ ОЗУ Сервер базы данных 2 четырехъядерных процессора Intel Xeon с частотой 2 ГГц (невиртуализованные) 16 ГБ ОЗУ (12 ГБ назначено SQL Server) Табл. (ii). Конфигурация оборудования Конфигурация хранилища Все пространство для хранения, использованное во время теста производительности, было настроено на базе устройства хранения StorSimple 10101. Базы данных системы SQL Server, базы данных SharePoint и хранилище больших двоичных объектов располагались на отдельных томах, как показано в приведенной ниже таблице (iii). Том Диск Базы данных SQL System C:\ Файлы данных и журналов временной базы данных H:\ Файл данных базы данных контента P:\ Файл журнала базы данных контента Q:\ Файл данных базы данных поиска S:\ Файл журнала базы данных поиска Q:\ Хранилище больших двоичных объектов X:\ Резервные копии O:\ Табл. (iii). Конфигурация хранилища Конфигурация программного обеспечения Версии и параметры программного обеспечения, использованные для разных серверов, приведены в таблице (iv) ниже. Программное обеспечение Дополнительные изменения Роль компьютера Интерфейсные 1 Windows Server® 2008 R2 Были применены все новые StorSimple 1010 представляет собой оптимизированное для приложений устройство хранения, которое ориентировано на такие приложения, как Microsoft SharePoint и Microsoft Exchange. Дополнительные сведения см. на сайте http://www.storsimple.com. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 10 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. веб-серверы и сервер приложений Enterprise x64 Сервер базы данных Windows Server 2008 R2 Enterprise x64 исправления для Windows Server. Microsoft SharePoint Server 2010 Из пакета дополнительных компонентов SQL Server 2008 R2 был установлен компонент RBS.msi. SQL Server 2008 R2 Enterprise x64 Были применены новые исправления для Windows Server.. В параметры сервера базы данных были внесены следующие изменения: - Для максимальной памяти сервера установлено значение 12 ГБ - Было создано 4 файла данных временной базы данных, которые были перемещены на свой собственный том. Табл. (iv). Конфигурация программного обеспечения Результаты тестирования и наблюдения В данном разделе приведена сводка результатов тестов, проведенных для измерения влияния от использования удаленного хранилища больших двоичных объектов для выноса контента больших двоичных объектов на различные атрибуты развертывания SharePoint Server 2010, а также для ответа на вопросы, перечисленные в приведенной ниже таблице (v). Описание теста 1 Влияние удаленного хранилища больших двоичных объектов на размер базы данных 2 Влияние удаленного хранилища больших двоичных объектов на размер резервной копии базы данных 3 Влияние удаленного хранилища больших двоичных объектов на время резервного копирования и восстановления 4 Влияние удаленного хранилища больших двоичных объектов на производительность перестроения индексов 5 Влияние удаленного хранилища больших двоичных объектов на время ответа транзакции SharePoint 6 Влияние удаленного хранилища больших двоичных объектов на операцию обхода 7 Влияние удаленного хранилища больших двоичных объектов на отправку файлов с переменным размером 8 Время, требуемое на перенос данных в удаленное хранилище больших двоичных объектов и из него Табл. (v). Сценарии тестирования © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 11 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. 1. Влияние удаленного хранилища больших двоичных объектов на размер базы данных SQL Server Как пояснено в разделе удаленного хранилища больших двоичных объектов, большинство данных в базе данных SQL Server соответствует данным больших двоичных объектов SharePoint. В большинстве клиентских развертываний SharePoint, особенно тех, где SharePoint используется для обеспечения совместной работы и управления записями, данные больших двоичных объектов составляют более 95 % размера базы данных. В зависимости от размера базы данных этот контент может быть легко переведен в сотни гигабайт данных базы данных. Хотя эта особенность и заложена при разработке, она создает множество трудностей и часто является фактором, ограничивающим использование SharePoint Server, масштабируемость решений и использование некоторых удобных возможностей, таких как корзины. В этих тестах, сводка по результатам которых приведена в данном разделе, мы измеряли размер базы данных, файлов данных и файла журнала транзакций для баз данных контента SharePoint размером 100 ГБ, состоящих из 100000 объектов, и для базы данных контента SharePoint размером 1 ТБ, состоящей из 2 миллионов объектов, с включенным и отключенным компонентом удаленного хранилища больших двоичных объектов. Размеры файлов для каждой из этих баз данных приведены в таблице (vi). Размер (ГБ) Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Размер базы данных (100 ГБ) 217,2 7,0 96,8 % Размер файла данных базы данных (100 ГБ) 106,9 3,2 97,0 % Размер файла журнала транзакций базы данных (100 ГБ) 111,6 3,8 96,6 % Размер вынесенных данных удаленного хранилища больших двоичных объектов -- 96,2 -- Размер базы данных (1 ТБ) 2292 26 98,9 % Размер файла данных базы данных (1 ТБ) 1120 6,5 99,4 % Размер файла журнала транзакций базы данных (1 ТБ) 1173 20 98,3 % Размер вынесенных данных удаленного хранилища больших двоичных объектов -- 1115 -- Уменьшение Табл. (vi). Размеры баз данных и файлов © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 12 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Рис. (iv). Размеры баз данных и файлов Как показано на приведенному выше рисунке (iv), без удаленного хранилища больших двоичных объектов общих размер баз данных после загрузки 100 ГБ и 1 ТБ контента SharePoint составил 217,2 ГБ и 2,29 ТБ соответственно. Для базы данных с 100 ГБ контента SharePoint 106,9 ГБ соответствовали фактическим данным базы данных, а остальные 111,6 ГБ соответствовали журналу транзакций базы данных. Аналогично для базы данных с 1 ТБ контента SharePoint — 1,12 ТБ соответствовало базе данных, а 1,2 ТБ соответствовало журналу транзакций. С включенным удаленным хранилищем больших двоичных объектов размер базы данных со 100 ГБ контента был на 96,8 % меньше, а размер базы данных с 1 ТБ контента — на 98,9 % меньше. Размеры файлов баз данных и журналов транзакций соответствующим образом уменьшились. Хотя потребность в дополнительном месте для хранения больших двоичных объектов в базе данных часто очевидна и понятна, менее очевидным недостатком являются трудности, связанные с увеличением размера файла журнала транзакций SQL Server. Причина такого роста заключается в том, что SQL Server является транзакционно согласованной базой данных, которая предоставляет полные свойства атомарности, согласованности, изолированности и долговечность. Этим обеспечивается наличие для транзакции только двух состояний — выполнена или не выполнена; какие-либо промежуточное состояние отсутствует. SQL Server реализует свойства атомарности, согласованности, изолированности и долговечности посредством полной регистрации каждой из операций в журнале транзакций базы данных с помощью сквозной записи на диск до выполнения операции. Свойства атомарности, согласованности, изолированности и долговечности применяются ко всем данным и типам данных SQL Server, включая большие двоичные объекты. Не существует механизма, с помощью которого это можно отключить или каким-либо образом обойти. Как можно того ожидать, при сохранении больших двоичных объектов SharePoint в базе данных SQL Server они записываются дважды — сначала в журнал транзакций, а затем в файл базы данных, о чем свидетельствует размер базы данных (2,29 ТБ), использованной для хранения 1 ТБ пользовательского контента. Этот файл журнала усекается при выполнении резервного копирования базы данных с выбранным параметром «Усечь журнал». © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 13 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Когда используется удаленное хранилище больших двоичных объектов для выноса контента больших двоичных объектов, данные этих объектов записываются в хранилище больших двоичных объектов перед выполнением операции SharePoint. Таким образом, свойства атомарности, согласованности, изолированности и долговечности для операции реализуются косвенно без излишней двойной записи в журнал транзакций. Степень уменьшения файлов данных и журнала транзакций баз данных зависит от объекта данных и частоты усечения журнала транзакций во время резервного копирования. Вынесенный контент больших двоичных объектов сохраняется в централизованной общей папке, которая доступна всем интерфейсным веб-серверами и серверу приложений SharePoint. Том этой общей папки может быть расположен на сервере базы данных или каком-либо другом сервере. На рисунке (v) показаны свойства общей папки, использованные в тестах производительности. Рис. (v). Размер тома общей папки удаленного хранилища больших двоичных объектов Примечание. Удаленное хранилище больших двоичных объектов сокращает размер базы данных посредством перемещения данных больших двоичных объектов во внешнее хранилище, при этом следует помнить о том, что общее место на диске, занимаемое данными больших двоичных объектов, не сокращается. Конечно, поставщики хранилищ могут помочь решить данную проблему с помощью запатентованных технологи, таких как дедупликация, для уменьшения места на диске. Большие двоичные объекты не удаляются автоматически из удаленного хранилища больших двоичных объектов при удалении соответствующего контента из SharePoint; для очистки потерянных больших двоичных объектов требуется выполнить отдельный цикл сборки мусора с помощью задания обслуживания, встроенного в удаленное хранилище больших двоичных объектов. 2. Влияние удаленного хранилища больших двоичных объектов на размер резервной копии базы данных В этих тестах, сводка по результатам которых приведена в данном разделе, мы измеряли влияние удаленного хранилища больших двоичных объектов на размер резервной копии базы данных на размер резервной копии базы данных для базы данных контента SharePoint размером 100 ГБ, © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 14 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. состоящей из 100000 объектов, и для базы данных контента SharePoint размером 1 ТБ, состоящей из 2 миллионов объектов. Эти тесты и соответствующий анализ не включали в себя использование удаленного хранилища больших двоичных объектов. Таким образом, методики и показатели длительности, которые связанны с резервным копированием и восстановлением данных больших двоичных объектов, размещенных в удаленном хранилище больших двоичных объектов, выходят за рамки данного технического документа. Для выполнения резервного копирования использовалась следующая команда Transact-SQL. BACKUP DATABASE [WSS_Content] TO DISK = N'O:\WSS_Content' WITH NOFORMAT, INIT, NAME = N'WSS_Content-Full Database Backup', SKIP, NOREWIND, NOUNLOAD; Кроме того, были проведены тесты для измерения влияния возможности сжатия резервной копии SQL Server2 на размер резервной копии с включенным и выключенным удаленным хранилищем больших двоичных объектов. Результаты наших тестов приведены в таблице (vii) ниже. Размер (ГБ) Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Размер файла данных базы данных (100 ГБ) 106.9 3.2 97.0% Размер резервной копии SQL Server (100 ГБ) 107.0 3.3 96.9% Размер резервной копии SQL Server со сжатием (100 ГБ) 71.5 0.7 99.1% Размер хранилища больших двоичных объектов (100 ГБ) 0 96.2 -- Размер файла данных базы данных (1 ТБ) 1120 6.5 99.4% Размер резервной копии SQL Server (1 ТБ) 1,119.0 6.6 99.4% Размер резервной копии SQL Server со сжатием (1 ТБ) 1,046.0 1.2 99.9% 0 1115 -- Размер хранилища больших двоичных объектов (1 ТБ) Уменьшение Табл. (vii). Размеры баз данных и резервных копий 2 Возможность сжатия резервных копий баз данных требует наличия SQL Server Enterprise. В SQL Server Standard и SQL Server Express данная возможность недоступна. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 15 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Рис. (vi). Размеры баз данных и резервных копий Как можно понять из приведенных выше рисунка и таблицы, размер резервной копии базы данных для 100 ГБ контента был на 96,9 % меньше (107 ГБ по сравнению с 3,3 ГБ), размер резервной копии базы данных для 1 ТБ контента был на 99,4 % меньше (1119 ГБ по сравнению с 6,6 ГБ) при включенном удаленном хранилище больших двоичных объектов. Для 100 ГБ контента размер вынесенных данных больших двоичных объектов составил 96,2 ГБ, а для базы данных 1 ТБ — 1115 ГБ. Когда для базы данных была включена возможность сжатия резервной копии SQL Server, размер резервных копий сократился еще больше — до 71,5 ГБ и 1046 ГБ соответственно без удаленного хранилища больших двоичных объектов и до 0,7 ГБ и 1,2 ГБ соответственно с удаленным хранилищем больших двоичных объектов. Обратите внимание на то, что сжатие резервной копии было эффективно при отключенном удаленном хранилище больших двоичных объектов, поскольку SharePoint Server сохраняет данные больших двоичных объектов в одной строке с другими данными (метаданные). Если бы хранение больших двоичных объектов было реализовано вне это строки, сжатие резервной копии не оказывало бы никакого эффекта, так как большие объекты, хранящиеся все строки, не сжимаются. Хотя в данном случае этот аспект является преимуществом, вызванное им увеличение рабочего набора и снижение эффективности кэша неизбежно приводят к снижению производительности. Поскольку большие двоичные объекты SharePoint являются неизменными, то есть после создания они уже не изменяются, резервную копию для контента больших двоичных объектов можно создать в любое время после завершения резервного копирования базы данных SQL Server. Это обеспечивает гибкость для выполнения быстрого и транзакционно согласованного резервного копирования базы данных SQL Server на определенный момент времени и последующего резервного копирования тома хранилища больших двоичных объектов. Резервная копия SQL Server и резервная копия удаленного хранилища больших двоичных объектов составляют полный набор резервных копий контента SharePoint. После создания этот набор резервных копий можно использовать для восстановления состояния базы данных SharePoint на момент запуска процесса резервного копирования SQL Server. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 16 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Примечание. При планировании стратегии резервного копирования и восстановления, включающей в себя сохранение данных в удаленном хранилище больших двоичных объектов, следует закладывать время на восстановление удаленного хранилища больших двоичных объектов. До завершения восстановления удаленного хранилища больших двоичных объектов документы SharePoint будут недоступны. 3. Влияние удаленного хранилища больших двоичных объектов на время резервного копирования и восстановления В этих тестах, сводка по результатам которых приведена в данном разделе, мы измеряли влияние удаленного хранилища больших двоичных объектов на время, требуемое на резервное копирование и восстановление базы данных. Аналогично предыдущему разделу мы использовали базу данных контента SharePoint размером 100 ГБ, состоящую из 100000 объектов. Была проведена серия тестов для измерения времени, требуемого для резервного копирования и восстановления баз данных с включенным и выключенным удаленным хранилищем больших двоичных объектов. Результаты этих тестов для базы данных размером 100 ГБ приведены в таблице (viii) ниже. Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Уменьшение Размер файла данных базы данных 106,9 3,2 97,0 % Время резервного копирования базы данных 2490 с 38 с 98,5 % Время восстановления базы данных 1290 с 28 с 97,8 % Время резервного копирования базы данных с включенным сжатием резервной копии 3160 с 37 с 98,8 % Время восстановления базы данных из сжатой резервной копии 1330 с 28 с 97,9 % Время резервного копирования хранилища больших двоичных объектов (моментальный снимок) -- 14 с -- Время восстановления хранилища больших двоичных объектов (моментальный снимок) -- 28 с -- Время резервного копирования хранилища больших двоичных объектов (команда копирования) -- 2578 с -- Время восстановления хранилища больших двоичных объектов (команда копирования) -- 2880 с -- Операция © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 17 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Табл. (viii). Время резервного копирования и восстановления для базы данных размером 100 ГБ Рис. (vii). Время резервного копирования и восстановления для базы данных размером 100 ГБ Время, затраченное на резервное копирование и восстановление базы данных, прямо пропорционально размеру этой базы данных. С учетом того, что размер базы данных был значительно меньше при включенном удаленном хранилище больших двоичных объектов, в данном случае затраченное время также сократилось на пропорциональную величину, как показано на рисунке (vii). При включенном удаленном хранилище больших двоичных объектов время, затраченное на резервное копирование базы данных, было на 98,5 % меньше (2490 с по сравнению с 38 с), а время, затраченное на восстановление базы данных, было на 97,7 % меньше (1284 с по сравнению с 28 с). Аналогичным образом время, затраченное на резервное копирование базы данных при использовании сжатия резервной копии базы данных SQL Server, было на 98,8 % меньше, а время, затраченное на восстановление сжатой резервной копии базы данных, было на 97,9 % меньше. Резервное копирование данных со сжатием резервной копии потребовало на 27 % больше времени и значительно больше ресурсов сервера SQL Server из-за выполнения дополнительных операций по сжатию данных. Для резервного копирования и восстановления баз данных использовались следующие команды: BACKUP DATABASE [WSS_Content] TO DISK = N'O:\WSS_Content' WITH NOFORMAT, INIT, N'WSS_Content-Full Database Backup', SKIP, NOREWIND, NOUNLOAD; NAME = BACKUP DATABASE [WSS_Content] TO DISK = N'O:\WSS_Content' WITH COMPRESSION, NOFORMAT, INIT, NAME = N'WSS_Content-Full Database Backup', SKIP, NOREWIND, NOUNLOAD; RESTORE DATABASE [WSS_Content] FROM DISK = N'O:\WSS_Content' WITH FILE = 1, MOVE N'WSS_Content' TO N'J:\ContentDB_Data\WSS_Content.mdf', MOVE N'WSS_Content_log' TO N'S:\ContentDB_Log\WSS_Content_log.LDF', NOUNLOAD, REPLACE; © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 18 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. При использовании удаленного хранилища больших двоичных объектов резервную копию для этого хранилища необходимо создавать отдельно. Такое резервное копирование можно выполнять асинхронно и параллельно с резервным копированием базы данных, единственное требование заключается в том, что удаленное хранилище больших двоичных объектов необходимо активировать после запуска резервного копирования базы данных. Для резервного копирования удаленного хранилища больших двоичных объектов можно использовать различные механизмы. В своих тестах мы измеряли время, затраченное на резервное копирование хранилища, с помощью механизма на базе моментальных снимков диска, а также на базе простого последовательного копирования каталогов. Для 100 ГБ контента время, затраченное на резервное копирование удаленного хранилища больших двоичных объектов с помощью моментального снимка диска, составило 14 с, а с помощью команды копирования — 2578 с. Примечание. При использовании поставщика FILESTREAM SharePoint 2010 автоматически выполняет резервное копирование или восстановление как данных больших двоичных объектов, так и метаданных. При восстановлении базы данных, для которой включено удаленное хранилище больших двоичных объектов, требуется восстанавливать и это хранилище больших двоичных объектов. Ферма SharePoint считается полностью восстановленной и доступной только после восстановления хранилища больших двоичных объектов. Для 100 ГБ контента время, затраченное на восстановление удаленного хранилища больших двоичных объектов с помощью моментального снимка диска, составило 28 с, а с помощью команды копирования — 2880 с. Стоит заметить, что удаленное хранилище больших двоичных объектов требуется восстанавливать только в том случае, когда оно было повреждено или перешло в недопустимое состояние. 4. Влияние удаленного хранилища больших двоичных объектов на производительность перестроения индексов Одной из характерных особенностей SharePoint Server является частая и обширная фрагментация таблиц серверной базы данных SQL Server, в которых хранится контент больших двоичных объектов. Такая фрагментация во многом заложена на этапе построения архитектуры и разработки приложения SharePoint, а также вызвана шаблоном доступа серверной базы данных SQL Server. Когда база данных фрагментируется, ее страницы, которые логически идут последовательно, в физическом файле данных не располагаются последовательно. Кроме того, страницы данных часто не используются в полной мере, в результате чего для хранения данных требуется большее число страниц с меньшей плотностью данных. Оба этих фактора вызывают чрезмерное увеличение рабочего набора, что может привести к снижению производительности. Хорошие новости состоят в том, что SharePoint 2010 автоматически снижает уровень фрагментации посредством выполнения правил анализатора работоспособности SharePoint. Эти правила регулярно проверяют фрагментацию индексов и запускают хранимую процедуру proc_DefragmentIndices для автоматической их дефрагментации. Однако следует помнить о том, что это ресурсоемкий процесс и что на время перестроения индексов вся ферма SharePoint становится недоступной. Это три следующих правила: Используемые SharePoint базы данных содержат фрагментированные индексы Одна или несколько баз данных обхода контента при поиске имеют фрагментированные индексы Индексы одной или нескольких баз данных свойств для поиска фрагментированы © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 19 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Вынесение больших двоичных объектов с помощью удаленного хранилища больших двоичных объектов значительно смягчает данную проблему, поскольку меньшая по размеру база данных требует меньше времени на перестроение индексов. Чтобы измерить влияние перестроения индексов, мы выполнили набор тестов, в которых мы принудительно выполняли операцию перестроение индексов для всех таблиц в базе данных контента SharePoint. Хотя это может не в полной мере отражать реальное развертывание, где индексы перестраиваются по необходимости, такой подход был выбран для того, чтобы сделать тест детерминированным и воспроизводимым. В рамках этих тестов мы измерили время, затраченное на перестроение индексов для баз данных контента размером 100 ГБ и 1 ТБ с включенным и выключенным удаленным хранилищем больших двоичных объектов. Мы также измерили влияние операции перестроения индексов на доступность и производительность фермы SharePoint. Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Уменьшение Время перестроения индексов для всех таблиц (100 ГБ) 120 с 4с 96,7 % Время перестроения индексов для всех таблиц (1 ТБ) 600 с 146 с 75,7 % Табл. (x). Фрагментация базы данных Как видно из приведенной выше таблицы (x) при включенном удаленном хранилище больших двоичных объектов время, затраченное на перестроение индексов для базы данных размером 100 ГБ, на 96,7 % меньше (120 с по сравнению с 4 с), а для базы данных размером 1 ТБ — на 75,7 % меньше (600 с по сравнению с 146 с). Поскольку при перестроении индексов веб-приложение SharePoint основную часть времени недоступно, такое уменьшение времени непосредственным образом влияет на доступность приложения SharePoint и разрешает более частое выполнение операции перестроения индексов, в результате чего обеспечивается более согласованная производительность. Было проведено несколько тестов для измерения влияния перестроения индексов на базу данных размером 100 ГБ с отключенным удаленным хранилищем больших двоичных объектов. На рисунке (viii) ниже показаны результаты одного из таких тестов, при котором моделировалась рабочая нагрузка отправки документов и в устойчивом состоянии была выполнена операция перестроения индексов. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 20 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Рис. (viii). Влияние операции перестроения индексов на производительность Можно видеть, во время нормальной работы (с 6:28 до 6:56) средняя скорость отправки файлов составляла 85 файлов в секунду. В 6:56 была запущена операция перестроения индексов, которая длилась 120 секунд. Как показано на графике, в течение этого времени скорость отправки файлов упала практически до нуля. На основании этого можно предположить, что набор пользовательских операций, выполнявшийся в этот промежуток времени, либо завис на 120 секунд, либо вообще завершился по тайм-ауту и вызвал отображение сообщения об ошибке на экране пользователя. Учитывая, что операция перестроения индексов при включенном удаленном хранилище больших двоичных объектов выполняется всего 4 секунды, это промежуток можно считать достаточно малым, чтобы оказываемое им влияние не было заметно. Фактически, снижение производительности было настолько незначительным, что его даже сложно отразить на графике, по этой причине оно намеренно не было указано на рисунке. Хотя этот тест был проведен с рабочей нагрузкой в виде отправки файлов, все типы транзакций оказывают одинаковое влияние на доступность фермы SharePoint. 5. Влияние удаленного хранилища больших двоичных объектов на время ответа транзакции SharePoint Как пояснено в предшествующих разделах, включение компонента удаленного хранилища больших двоичных объектов приводит к уменьшению размера баз данных контента SharePoint, что в свою очередь требует меньшего объема ресурсов от сервера базы данных SQL Server для выполнения запросов. Такие сэкономленные ресурсы освобождаются для ускорения обработки существующих запросов и для обслуживания большего числа запросов. В этом тесе, сводка по результатам которого приведена в данном разделе, мы измеряли влияние включения удаленного хранилища больших двоичных объектов на время ответа транзакций. Для данного теста мы использовали рабочую нагрузку в виде набора полных транзакций SharePoint, © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 21 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. которая подробнее описана в разделе «Методика тестирования». Эта рабочая нагрузка запускалась на 6 драйверах загрузки, которые моделировали пользовательскую нагрузку в виде 100 пользователей, выполняющих транзакцию SharePoint в среднем каждые 15 секунд. Каждый тест запускался в течение 5 минут с нарастанием интенсивности, а затем непрерывно выполнялся в течение 2 часов. Среднее время ответа измерялось за все время 2-часового устойчивого состояния. Эти высокоуровневые результаты приведены в таблице (xi) ниже. Метрика Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Уменьшение Максимальная пользовательская нагрузка 100 100 0,0 % Запросов/с 84 84,3 -0,4 % Сбои запросов 0 0 Среднее время ответа 28 мс 21 мс 25,0 % Тестов/с 6,4 6,42 -0,3 % Среднее время создания страницы 210 мс 160 мс 23,8 % 0,0 % Табл. (xi). Метрики теста времени ответа транзакций Среднее время ответа для всех транзакций было на 25 % меньше (28 мс по сравнению с 21 мс), когда для базы данных контента было включено удаленное хранилище больших двоичных объектов. Отсюда можно сделать вывод, что при включенном удаленном хранилище больших двоичных объектов среднее время ответа транзакций SharePoint у конечного пользователя было на 25 % меньше для разных типов транзакций. С учетом того, что производительность и удовлетворенность пользователей SharePoint часто зависит от времени ответа транзакций SharePoint, его 25%-ное снижение приведет к росту уровня производительности и удовлетворенности. В таблице (xii) ниже приведены более подробные сведения о времени ответа для каждой из четырнадцати пользовательских транзакций. Среднее время транзакции (c) % транзакции Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Общедоступная страница личного сайта 16,0 % 0,14 0,08 42,9 % Домашняя страница 25,0 % 0,43 0,22 48,8 % Транзакция Уменьшение © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 22 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Рабочий процесс для страниц 1,1 % 109,00 109,00 0,0 % Создание страницы 6,0 % 15,72 15,67 0,3 % Создание сайта публикации 1,0 % 13,00 12,70 2,3 % Создание сайта группы 1,0 % 17,90 18,30 -2,2 % Загрузка документа 12,2% 4,03 4,03 0,0 % Профиль изменения личного сайта 6,9 % 29,84 29,90 -0,2 % 10,1 % 0,12 0,09 25,0 % Запрос поиска 14,8% 60,00 60,10 -0,2 % Диспетчер сайтов 1,0 % 0,45 0,31 31,1 % Отправка документов 4,9 % 30,20 30,50 -1,0 % Большая страница Табл. (xii). Время ответа транзакций Рис. (ix). Время ответа транзакций Как показано выше, среднее время ответа для 10 из 14 транзакций при включении удаленного хранилища больших двоичных объектов осталось неизменным или улучшилось, для четырех транзакций улучшение составило почти 50 %. Производительность четырех остальных транзакций снизилась менее чем на 2,2 %, что с большой вероятностью останется незамеченным фактическим пользователем. В общем случае при включении удаленного хранилища больших двоичных объектов © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 23 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. можно ожидать повышения производительности для крупных файлов, особенно, для систем, связанных с вводом-выводом, так как операции ввода-вывода перенаправляются вне базы данных SQL Server. Для более мелких файлов может наблюдаться относительное снижение производительности, поскольку интерфейсному веб-серверу приходится выдавать два запроса вместо одного. Однако можно ожидать, что такой относительный рост не будет заметен даже при большем различии между величинами, так как время доступа к файлам пренебрежимо мало. 6. Влияние удаленного хранилища больших двоичных объектов на производительность обхода Поиск является неотъемлемой частью большинства развертываний SharePoint и одной из самых ресурсоемких служб SharePoint. Многие корпоративные развертывания имеют большую долю пользователей, которые осуществляют доступ к данным посредством перехода с портала поиска вместо доступа непосредственно к нужному сайту или документу. Такое поведение вызывает интенсивное использование поиска, поэтому неудивительно, что многие клиенты считают поиск главным потребителем ресурсов или узким местом. Существует два компонента поиска SharePoint Server — обход при поиске и запрос поиска. Процесс обхода при поиске включает в себя программы-обходчики, которые обходят область поиска и формируют (или обновляют) индекс поиска. Индекс поиска SharePoint состоит из двух частей — базы данных поиска и неструктурированного файла индекса поиска. Запросы поиска в свою очередь используют базу данных поиска и индекс для возврата результатов пользователю. В этих тестах, сводка по результатам которых приведена в данном разделе, мы измеряли время, требуемое на обход области поиска с использованием одного сервера приложений с предустановленными параметрами поиска. Результаты по времени, затраченному с включенным и выключенным удаленным хранилищем больших двоичных объектов, приведены в таблице (xiii) ниже. Результаты по запросам поиска были представлены в предыдущем разделе, поэтому здесь они отсутствуют. Операция Полный обход контента при поиске Число объектов Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов Уменьше ние 503206 150 минут 146 минут 2,7 % Табл. (xii). Время обхода при поиске © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 24 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Рис. (x). Сводка по полному обходу контента при поиске Как можно понять из приведенных выше результатов, включение удаленного хранилища больших двоичных объектов для баз данных области поиска оказывает очень незначительное влияние на производительность, прирост которой составляет всего 2,7 %. Это соответствует нашим ожиданиям, так как в обоих случаях выполняется примерно одинаковый объем операций. 7. Влияние удаленного хранилища больших двоичных объектов на производительность отправки файлов Время, затрачиваемое на отправку больших файлов в SharePoint Server, часто не позволяет пользователям отправлять большой объем контента. Наиболее часто пользователи жалуются на то, что копирование файла в общую папку Windows занимает в разы меньше времени, чем отправка того же файла в SharePoint Server. Одна из причин этого заключается в том, что по умолчанию все содержимое файла сохраняется в базе данных SQL Server, что имеет собственные ограничения. Кроме того, с учетом того, что база данных SQL Server работает по транзакционно согласованной модели, в дополнение к сохранению фактической копии большого двоичного объекта в базе данных требуется регистрировать весь этот большой двоичный объект BLOB в журнале транзакций SQL Server, что создает для системы двойную нагрузку в виде операций ввода-вывода. Удаленное хранилище больших двоичных объектов значительно повышает производительность отправки крупных файлов благодаря выводу большого двоичного объекта непосредственно из интерфейсного веб-сервера, в результате чего нагрузка в виде операций ввода-вывода на систему SQL Server минимизируется. В результатах тестов, сводка по которым приведена в данном разделе, мы моделировали развертывание управления цифровыми активами SharePoint и измеряли производительность отправки файлов размером от 1 МБ до 1,99 ГБ с включенным и выключенным удаленным хранилищем больших двоичных объектов. Результаты по времени, затраченному на отправку файлов с включенным и выключенным удаленным хранилищем больших двоичных объектов, приведены в таблице (xiv) ниже. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 25 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Время, затраченное на отправку файла (с) Размер файла Без удаленного хранилища больших двоичных объектов С удаленным хранилищем больших двоичных объектов 1 МБ 1,2 1,0 16,7 % 100 МБ 12,2 9,7 20,5 % 500 МБ 55 28,8 47,6 % 1 ГБ 69,4 48 30,8 % 1,5 ГБ 138 71 48,6 % 1,99 ГБ 178 87 51,1 % Уменьшение Табл. (xiv). Время отправки файлов Рис. (xi). Время отправки файлов Как видно из таблицы и графика, время, затраченное на отправку файла при включенном удаленном хранилище больших двоичных объектов на 15–50 % меньше, чем при выключенном удаленном хранилище больших двоичных объектов. В абсолютном отношении это означает отправку файла размером 1,99 ГБ за 87 секунд по сравнению с 178 секундами, что представляет собой значительное отличие для отправляющих файл пользователей, с учетом того, что перед продолжением работы они просто сидят перед окном веб-браузера и ждут завершения операции. Для сотен пользователей в © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 26 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. организации, каждый из которых выполняет десятки таких операций, экономия времени и преимущества быстро становятся очевидны, особенно это заметно при наличии узкого места с ресурсами на сервере. Аналогичные преимущества справедливы и для операций загрузки файлов, хотя при загрузке система SQL Server и интерфейсный веб-сервер SharePoint помещают данные файлов в буфер, что позволяет снизить затраты ресурсов во внутреннем хранилище. 8. Время, требуемое на перенос данных После включения удаленного хранилища больших двоичных объектов для базы данных все отправляемые или изменяемые файлы автоматически выносятся в удаленное хранилище больших двоичных объектов, сопоставленное с активным поставщиком. Объекты, которые ранее хранились в базе данных, продолжают оставаться в ней, доступ к ним также осуществляется из этой базы данных; автоматический перенос этих файлов за пределы удаленного хранилища больших двоичных объектов не выполняется. При такой конфигурации SharePoint обеспечивает беспроблемный доступ как к файлам, которые были вынесены посредством удаленного хранилища больших двоичных объектов, так и к файлам, которые все еще хранятся в базе данных. Хотя описанный выше механизм работает хорошо, со временем пользователи могут захотеть перенести весь существующий контент, который мог храниться в базе данных, во внешнее удаленное хранилище больших двоичных объектов, либо они могут захотеть перенести весь вынесенный в удаленное хранилище больших двоичных объектов контент обратно в базу данных. Обе эти операции можно выполнить с помощью командлета Migrate() Windows PowerShell™ 2.0, который входит в состав SharePoint Server 2010. Точная последовательность команд Windows PowerShell приведена в следующем скрипте. $cdb=Get-SPContentDatabase <ContentDbName> $rbss=$cdb.RemoteBlobStorageSettings $rbss.GetProviderNames() $rbss.SetActiveProviderName($rbss.GetProviderNames()[0])3 $rbss.Migrate() Эта операции необходимо выполнить для каждой базы данных, на которую вы хотите перенести большие двоичные объекты. Выполнение данного скрипта Windows PowerShell, когда включен поставщик удаленного хранилища больших двоичных объектов, приводит к переносу больших двоичных объектов из базы данных в удаленное хранилище больших двоичных объектов, в то время как выполнение данного скрипта Windows PowerShell, когда поставщик удаленного хранилища больших двоичных объектов выключен, приводит к переносу больших двоичных объектов обратно в базу данных. 3 Примечание. $rbss.GetProviderNames()[0] соответствует поставщику удаленного хранилища больших двоичных объектов StorSimple. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 27 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. Учитывая, что база данных контента может хранить тысячи или даже миллионы объектов, требуется внимательно проанализировать перенос данных, так как для выполнения операций может потребоваться длительное время. Командлет Migrate() рекомендуется запускать в нерабочее время со слабо загруженного интерфейсного веб-сервера SharePoint или сервера приложений. В рамках тестов мы запускали приведенный выше скрипт с сервера приложений для переноса 500000 объектов SharePoint, средний размер каждого из которых составлял 100 КБ, в базу данных и из нее. Результаты наших тестов приведены в таблице (xv) ниже. Операция Затраченное время (мин) Переносимых больших двоичных объектов в секунду Миграция данных из базы данных контента в хранилище больших двоичных объектов (вынос данных) 243 34.3 Миграция данных из хранилища больших двоичных объектов в базу данных контента (поглощение данных) 504 16.5 Табл. (xv). Время переноса для удаленного хранилища больших двоичных объектов Мы отнесли дополнительное время, затраченное на миграцию в базу данных контента, на счет дополнительной обработки в SharePoint Server и SQL Server, которая должна быть выполнена в серверной части. Чтобы убедиться, что результаты были сопоставимы, и обеспечить соответствие требованиям по поддержку корпорации Майкрософт, никакая дополнительная настройка базы данных SQL Server, кроме указанной в разделе о конфигурации программного обеспечения, не проводилась. Метод Migrate удаленного хранилища больших двоичных объектов может быть перезапущен для начала переноса больших двоичных объектов в базу данных или из нее с использованием расположения, на котором этот метод прекратил работу во время предыдущего вызова. Заключение В данном документе показано, как использование удаленного хранилища больших двоичных объектов может помочь уменьшить эффективный размер базы данных контента SharePoint и размер резервной копии более чем на 95 %, в результате чего время резервного копирования сокращается на аналогичную величину и появляются возможности использования более дешевого хранилища для сохранения данных больших двоичных объектов. Здесь также показано, как компонент удаленного хранилища больших двоичных объектов помогает пользователям сохранять крупные мультимедийные файлы в SharePoint Server и использовать все преимущества SharePoint Server без образования узких мест для базы данных SQL Server и без чрезмерного удорожания решения. Мы также проанализировали влияние удаленного хранилища больших двоичных объектов на время обхода контента при поиске, производительность задачи перестроения индекса (сокращение времени на 96 %) и время ответа транзакций конечных пользователей (которое сократилось на 30 % и более для некоторых транзакций). Наконец, мы отдельно измерили производительность отправки крупных © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 28 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]). Microsoft SharePoint Server 2010 Апрель 2011 г. мультимедийных файлов и время переноса данных больших двоичных объектов в базу данных и из нее с использованием удаленного хранилища больших двоичных объектов. В итоге мы выяснили, что использование удаленного хранилища больших двоичных объектов упрощает обслуживание фермы SharePoint и улучшает масштабируемость решения. В свою очередь это обеспечивает снижение издержек и улучшение взаимодействия с пользователем. Однако при использовании удаленного хранилища больших двоичных объектов операции обслуживания, такие как резервное копирование хранилища больших двоичных объектов, должны тщательно планироваться и раскладываться на составные части в списке задач обслуживания. Дополнительные ресурсы Обзор удаленного хранилища больших двоичных объектов — http://technet.microsoft.com/enus/library/ee748649.aspx (возможно, на английском языке) Перенос контента в удаленное хранилище больших двоичных объектов и из него — http://technet.microsoft.com/en-us/library/ff628254.aspx (возможно, на английском языке) StorSimple SharePoint Database Optimizer — http://www.storsimple.com/ (возможно, на английском языке) Тесты производительности Microsoft Office SharePoint Server 2007 — http://sptdatapop.codeplex.com/releases/view/1214#DownloadId=6918 (возможно, на английском языке) Пакет дополнительных компонентов для Microsoft® SQL Server® 2008 R2 — http://www.microsoft.com/downloads/details.aspx?displaylang=en&FamilyID=ceb4346f-657f-4d28-83f5-aae0c5c83d52 (возможно, на английском языке) Сведения о StorSimple Решение StorSimple устраняет основные проблемы для хранилища, связанные с производительностью, масштабируемостью, управляемостью, защитой данных и затратами для Microsoft SharePoint Server 2010. StorSimple предоставляет вам уникальную возможность развернуть локальное хранилище нового поколения, позволяющее решать возникающие проблемы с приложениями, и начать использовать общедоступное или частное облачное хранилище в удобное для вас время. Дополнительные сведения о StorSimple см. на сайте www.storsimple.com (возможно, на английском языке). Сведения о корпорации Майкрософт Корпорация Майкрософт является публичной международной корпорацией (со штаб-квартирой в городе Редмонд, штат Вашингтон, США), мнгочисленные подразделения которой занимаются разработкой, производством, лицензированием и поддержкой обширного диапазона продуктов и услуг, преимущественно связанных с вычислениями. © Корпорация Майкрософт (Microsoft Corporation), 2011. Все права защищены. Стр. 29 Чтобы оставить комментарий к этому документу или запросить дополнительную информацию о данных функциях, обратитесь в отдел документации для ИТ-специалистов по SharePoint ([email protected]).