MS Excel Part II Удобности • • Выделение области, напр. A5:B120000 (окошко рядом с fx) Выделение набора столбцов, набора строк, всего листа (щелчок по именам столбцов, номерам строк, удерживая Ctrl, если много) • Переход – к заданной ячейке, напр. F10259 – к краю заполненного диапазона (Ctrl+стрелка) • • • • • Автозаполнение арифметической прогрессии (тянуть за уголок). Суммирование непрерывного диапазона чисел (значок Автосуммирование) Поиск/замена символа/слова на другой/другое везде, где он встретился в выделенном диапазоне (Ctrl+F/Ctrl+H). Отмена последнего действия (Ctrl+Z) Введение и редактирование формулы (через fx , в ячейку или окошко формул начиная с “=“) • Вставка – значения в ячейку без изменения формата ячейки (в окошко формул) – cпециальная вставка (через правую кнопку мыши) • Изменение числа отображаемых десятичных знаков в числе (формат ячейки через правую кнопку мыши или меню формат) • Распространение формулы • – Ctrl+D, Ctrl+R – Мышью за правый нижний уголок Вставка пустого столбца/строки (выделить и нажать Вставить в Главном меню) 2 … и не очень удобности • Как ввести символы +, –, = как текстовые значения? (написать ‘+ и т.п.) • Как бороться с тем, что число вида 10.12 превращается при вводе в “10 декабря” или чтото вроде того? (никак; надо ввести заново, указав, что это число) • Как задать условие в команде countif [счётесли]? (например так: =countif(A:A,”>=“&B1) – считай значения в колонке A большие или равные значению ячейки B1; выражение ”>=“&B1 есть короткая запись команды concatenate(“>=“,B1) ) 3 Эффект каких клавиш и сочетаний надо знать • • • • • • • <Tab> <Enter> <Shift+Tab> <Shift+Enter> <F2> стрелки ←,↑,↓, → <Delete> • • • • • • • <Shift+стрелка> <Ctrl+стрелка> <Shift+Ctrl+стрелка> <Ctrl+F> <Ctrl+H> <Ctrl+S> <Ctrl+Z> 4 Специальная вставка 5 Специальная вставка 6 Гистограммы: пример Число G-квадруплексов 120 Гистограмма расстояния от вероятных Gквадруплексов до стартов транскрипции генов человека 100 80 60 40 20 1000-1050 900-950 800-850 700-750 600-650 500-550 400-450 300-350 200-250 100-150 0-50 -100--50 -200--150 -300--250 -400--350 -500--450 -600--550 -700--650 -800--750 -900--850 -1000--950 0 Расстояние до старта транскрипции (п.н.) Вероятный G-квадруплекс: GGGN(1,7)GGGN(1,7)GGGN(1,7)GGG 7 Гистограммы Теория • Дано: – выборка объектов – параметр каждого объекта • Задача: – описать распределение параметров • Решение: – выбрать интервалы значений – посчитать число объектов попавших в каждый интервал – представить графически Пример • Дано: – геномы вирусов из БД – размер генома в КБ • Задача: – описать распределение размеров • Решение: – выберем карманы: 0-5кб, 5-10кб, …. – посчитаем число геномов, попавших в каждый карман – построим диаграмму в виде столбиков 8 (0-5] (5-10] (10-15] (15-20] (20-25] (25-30] (30-35] (35-40] (40-45] (45-50] (50-55] (55-60] (60-65] (65-70] (70-75] (75-80] (80-85] (85-90] (90-95] (95-100] (100-2500] число геномов Как построить в Excel? Гистограмма размеров геномов вирусов (КБ) 1400 1200 1000 800 600 400 200 0 Размер генома в КБ 9 Есть или может быть подключена команда посотроения гистограммы • Меню Данные => Анализ данных => гистограмма • Если нет Анализа данных, то подключить его так: – Меню Большой круг – где сохранение => Параметры => Надстройки => Надстройки Excel Перейти => галочку возле Пакет анализа (не путать с Пакет анализа VBA!) • Не советую использовать, так как при любом изменении карманов надо все делать заново 10 Гистограммы Теория • Задача: – сравнить распределения для разных групп объектов • Проблема: – в разных группах разное число объектов • Решение: – разделить число объектов в кармане на число объектов в группе и умножить на 100% – представить на одном графике распределения для всех групп Пример • Задача: – Сравнить распределения размеров для РНК-вирусов, ДНК-вирусов и др. • Проблема: – Группы вирусов различаются по числе известных геномов • Решение: – карману 0-5кб для ДНКвирусов приписываем: (число ДНК-вирусов размера 05кб)*100%/(число всех ДНК-вирусов) – представляем на одном графике распределения для всех типов вирусов Полученные графики называются выборочной плотностью распределения 11 Как построить в Excel? Как построить решить: определяется ли различие гистограмм случайностью выборки или имеет биологический смысл? 12 Какие ответы дает МатСтатистика – число успехов = 5 • Пять орлов при 20и бросаниях: – число испытаний = 20 случайность или монета – вероятность успеха = 0.5 кривая? – интегральная = ИСТИНА (т.к. <= 5 • Число “успехов” при многих успехов) бросаниях имеет Ответ: P = 0.02 распределение Бернулли, оно • Интерпретация: вероятность же – биномиальное получить такой исход 20и • Найдем вероятность P того, бросаний при правильной что при двадцати монете равна 0.02. Очевидно, независимых бросаниях с еще такая же вероятность вероятностью успеха 0.5 получить 15 или более решек выпадет 5 или менее успехов • 1000 генов на прямой цепи • В Excel: fx => статистические => ДНК из 2200и генов всего: биномраспр: – случайность или – имеет биологический смысл? 13 Stop 14 Фильтр данных Меню – Данные – Фильтр 15 Построение диаграмм Menu – Insert – Chart Меню – Вставка – Диаграмма 17 Построение диаграмм 18 Настойка диаграммы 19 Гистограмма Гистограмма – средство анализа, которое рассчитывает частоты значений в выбранных диапазонах данных. Пример: есть таблица молекулярных масс аминокислот. С помощью этого инструмента можно узнать распределение мол.масс а/к (т.е. сколько а/к имеют мол.массу в пределах от 110 до 130,например) 24 Гистограммы Menu – Data – Data Analysis Меню – Данные – Анализ данных 25 Гистограммы 26 Гистограммы 27 Гистограммы 28 Создание сводной таблицы (1) Выделить таблицу Обязательно с заголовками! (2) Вставка => сводная таблица (pivot table) (3) Ok; Ok (согласиться с выделением; согласиться результат поместить на новом листе) (4) Результат выглядит примерно так, как на скриншоте слева (5) Перетащите мышкой поле (код остатка) как показано (6) Перетащите любое поле как показано пунктирной стрелкой (7) Увидите результат 29 Посмотрите на результат В колонке “итог” – число встреч буквы в поле “остаток” 30