рефераты бесплатно
 

МЕНЮ


Учебное пособие: Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белков

-  STRUCTURE (файл structur.exe) - программа, обеспечивающая интерфейс для всех программ пакета, позволяющая также создавать и редактировать файлы данных в универсальном для всех программ формате.

-  CONTIN (файл contin.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].

-  PROVCD (файл provcd.exe) - программа, осуществляющая проведение статистического теста для программы CONTIN.

-  DEF_CLASS (файл def_clas.exe) - программа, определяющая тип третичной структуры белка.

-  CDESTIMATE (файл cdestima.exe) - программа, определяющая вторичную структуру белка методом "эталонных спектров" [3].

-  VARSELEC (файл varselec.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" с процедурой "выбора переменных" [7].

-  RUN.BAT - командный файл, используемый для запуска программ пакета в условиях недостаточного объема оперативной памяти.

-  *.DAT - файл, содержащий спектр КД белка, а также данные о его вторичной структуре (если они известны).

-  *.GRP - файл, содержащий список базисных спектров КД (принадлежащих одной из базисных групп).

-  *.STR - файл, содержащий набор структурных типов (элементов вторичной структуры белка).

После запуска файла structur.exe на экране появляется главное меню программы, состоящее из следующих пунктов:

1.  File - создание и редактирование файлов данных;

2.  Group - создание и редактирование групп базисных спектров КД белков;

3.  Calculate - выбор метода анализа, анализируемого спектра, группы базисных спектров, запуск вычислений и просмотр результатов;

4.  Options - выбор набора структурных типов;

5.  Setup - изменение цветового оформления окон программы;

6.  Quit - выход из программы.

В нижней части экрана располагаются три окна, содержащие информацию об анализируемом спектре КД (Protein), а также о выбранных для анализа группе базисных спектров (Group) и наборе типов вторичной структуры белка (Structures).

Создание и редактирование файлов данных. Создание и редактирование файлов данных осуществляется с помощью команд меню File/Create и File/Edit соответственно. В файл необходимо внести следующую информацию:

-  Комментарий длиной не более 45 символов (пункт меню Comment).

-  Идентификатор длиной не более 7 символов, который становится именем файла и автоматически приобретает расширение.dat (пункт меню Identificator).

-  Содержание в белке (относительные доли) различных типов вторичной структуры по данным рентгеноструктурного анализа (пункт меню Structure data). Эти данные необходимы только в случае использования вводимого спектра в дальнейшем в качестве базисного.

-  Диапазон и шаг по длинам волн, а также сам спектр КД (пункт меню Spectrum). Для программы CDESTIMATE диапазон анализируемого спектра не должен быть шире, чем 240 - 190 нм, а шаг должен быть равен 1 нм или больше. Для программы CONTIN число точек в анализируемом спектре не должно превышать 51. Для программ CONTIN, VARSELEC и PROVCD диапазон анализируемого спектра не должен быть шире диапазона базисных спектров, а шаг должен совпадать с шагом базисных спектров.

После ввода всей перечисленной выше информации необходимо сохранить ее с помощью пункта меню Save. При необходимости можно построить введенный спектр КД на экране в графическом виде с помощью пункта меню View.

Команды меню File/Load и File/Delete используются соответственно для добавления новых спектров в список рабочих спектров, запоминаемых программой, и для удаления из него ненужных спектров. Для добавления нового спектра с помощью команды Load необходимо указать имя файла, в котором он хранится (предварительно его надо записать в текущий каталог). При удалении какого-либо спектра из списка с помощью команды Delete соответствующий ему файл не удаляется, поэтому его всегда можно будет включить обратно в список с помощью команды Load.

Создание и редактирование групп базисных спектров. В программе STRUCTURE уже существует 6 предопределенных групп базисных спектров, соответствующих различным методам анализа спектров КД. Эти группы имеют следующие имена:

-  PG_3_16.GRP и PG_4_16.GRP - базисные наборы, состоящие из 16 спектров, использованные для анализа авторами метода "регуляризации" [4] (Provencher & Glockner), предназначенные для определения вторичной структуры по 3 и 4 структурным классам соответственно (смотри ниже);

-  PG_3_20.GRP и PG_4_20.GRP - базисные наборы, содержащие те же самые 16 спектров, что и в двух предыдущих наборах, плюс 4 спектра денатурированных белков;

-  HJ_16.GRP и HJ_22.GRP - базисные наборы, состоящие из 16 и 22 спектров соответственно, использованные для анализа авторами метода "ортогональных спектров" [7] (Henessey & Johnson), предназначенные для определения вторичной структуры по 5 структурным классам (смотри ниже).

В программе предусмотрена возможность создания собственных групп базисных спектров. Для этого необходимо воспользоваться командой главного меню Group/Create, позволяющей выбрать из списка существующих спектров те, которые вы хотите включить в свой базисный набор. Аналогичным образом осуществляется редактирование групп базисных спектров (команда главного меню Group/Edit). Удаление группы базисных спектров осуществляется с помощью команды главного меню Group/Delete.

Выбор набора структурных типов. В программе STRUCTURE предопределены следующие 3 набора типов вторичной структуры белка:

Provencher 3 (PG3.STR)

ALFA_hl (a-спираль)

BETA_sh (b-структура)

Remain (остальные типы)

Provencher 4 (PG4.STR)

ALFA_hl (a-спираль)

BETA_sh (b-структура)

BETA_tn (b-поворот)

Remain (остальные типы)

Johnson 5 (HJ.STR)

ALFA_hl (a-спираль)

BETA_Ash (антипараллельная b-структура)

BETA_Psh (параллельная b-структура)

BETA_tn (b-поворот)

Other (остальные типы)

Набор All structures (FULL.STR) содержит дополнительные типы вторичной структуры белка, однако он ни с одной из предопределенных групп базисных спектров не используется.

Каждая группа базисных спектров соответствует одному из выше перечисленных наборов структурных типов. Это соответствие выглядит следующим образом:

PG_3_16.GRP и PG_3_20.GRP - Provencher 3;

PG_4_16.GRP и PG_4_20.GRP - Provencher 4;

HJ_16.GRP и HJ_22.GRP - Johnson 5.

При выборе одной из групп базисных спектров необходимо выбрать соответствующий набор типов вторичной структуры белка. Выбор нужного набора структурных типов осуществляется с помощью команды главного меню Options/Structure types.

Запуск вычислений. Для начала вычислений необходимо воспользоваться командой главного меню Calculate. В появляющемся меню нужно выбрать один из предлагаемых методов вычислений. В появляющемся после этого списке имеющихся белковых спектров необходимо выбрать анализируемый спектр. Если для расчетов были выбраны программы CONTIN, VARSELEC, PROVCD или DEF_CLASS, то необходимо также выбрать группу базисных спектров, на которой будут основаны вычисления. После этого производится запуск вычислений.

Если для расчетов была выбрана программа VARSELEC, то необходимо также установить порядок исключения спектров из исходного базисного набора для процедуры "выбора переменных" с помощью команды главного меню Options/Var.select. Для этого необходимо указать число спектров, исключаемых на каждом шаге вычислений. После его задания автоматически вычисляется общее количество шагов, требуемых для перебора всех возможных комбинаций. Если перебор всех возможных комбинаций не требуется, необходимо указать номер начальной и конечной комбинации.

Время вычислений равняется в среднем 1-3 минутам, однако может составлять значительно больший интервал для программы VARSELEC при задании очень большого количества комбинаций базисных спектров.

Результаты вычислений можно просмотреть с помощью команды Calculate/Result.


2. Инфракрасные спектры поглощения белков 2.1 Поглощение белков в ИК-области

Поглощение света в видимом и ультрафиолетовом диапазонах обусловлено электронными переходами в молекулах поглощающего вещества. Поглощение света в инфракрасном диапазоне имеет иную природу. Оно связано с переходами между колебательными уровнями основного состояния молекулы. Полосы поглощения, отвечающие колебательным переходам, обычно лежат в диапазоне длин волн от 2000 до 50000 нм или, как принято записывать для ИК-спектров, в диапазоне волновых чисел от 5000 до 200 см-1.

Колебательные спектры подчиняются в сущности тем же закономерностям, что и электронные. Однако для колебательных переходов характерна значительно меньшая интенсивность, чем для электронных. Следовательно, при регистрации ИК-спектра образец должен быть гораздо более концентрированным. Кроме этого, многие полосы ИК-спектров белков, в том числе соответствующие пептидным хромафорам, расположены в той спектральной области, где наблюдается сильное поглощение воды. Использование D2О вместо Н2О иногда помогает обойти эту трудность, но не решает проблему полностью, поскольку полная замена лабильных протонов белка на дейтерий часто связана с потерей его нативной конформации.

Описываемый ниже метод определения вторичной структуры белка основан на использовании ИК-спектров поглощения белков в Н2О [8-10]. Проблема, связанная с их измерением, была решена авторами метода с помощью довольно сложной процедуры компенсации поглощения воды и использования очень узких ячеек (с длиной оптического пути около 6-12 мкм). Поскольку все измерения проводились в Н2О трудностей с поддержанием нативной конформации белков не возникало.

Колебательные полосы поглощения обычно порождаются переходами, которые можно довольно точно отнести к определенным химическим связям. В случае белков наиболее интересными являются три инфракрасные полосы, соответствующие колебательным переходам в пептидном остове. Это полосы, связанные с растяжением связи N-H (около 3300 см-1), растяжением связи C=O (1640-1660 см-1, полоса амид I) и деформацией связи N-H (1520-1550 см-1, полоса амид II). Эти полосы довольно легко зарегистрировать, поскольку каждое пептидное звено дает вклад в их интенсивность.

Образование водородных связей при формировании вторичной структуры белка приводит к сдвигу энергии этих трех пептидных колебаний. Первые две полосы, отвечающие валентным колебаниям, смещаются в область более низких энергий, поскольку наличие водородной связи облегчает смещение атома азота амидной группы и атома кислорода карбонильной группы в направлении акцептора или донора протона соответственно. Полоса амид II смещается в сторону более высоких энергий, так как водородная связь препятствует изгибанию связи N-H.

Влияние водородных связей на полосы амид I и амид II в случае a-спирали и b-структуры оказывается различным, что дает возможность использовать ИК-спектры для определения вторичной структуры белков. Ниже представлена таблица, суммирующая данные о влиянии вторичной структуры на положение полос амид I и амид II. В ней приведены положения максимумов (n0) и значения интенсивности в максимумах (Е0) для полос амид I и амид II, усредненные по нескольким модельным полипептидам и фибриллярным белкам в Н2О [9]:

Тип вторичной Амид I Амид II
структуры

n0, см-1

Е0, л·моль-1·см-1

n0, см-1

Е0, л·моль-1·см-1

a-спираль 1647 700

1551

1520

310

80

b-структура

1695

1619

180

980

1533

1563

340

100

неупорядочен-

ная форма

1651 320 1550 210

Следует отметить, что расщепление полос амид I и амид II происходит за счет взаимосвязанности колебаний в отдельных пептидных группах.

На рисунке 2.1.1 представлены ИК-спектры трех модельных полипептидов, находящихся в конформациях a-спирали, b-структуры и неупорядоченной формы.

2.2 Методы анализа ИК-спектров белков

В целом, проблемы, решаемые при анализе ИК-спектров белков с целью определения их вторичной структуры, очень схожы с проблемами, возникающими при анализе спектров кругового дихроизма белков. При этом также используется набор ИК-спектров белков с известной вторичной структурой, используемых в качестве базисных. Так, например, в методе, описанном в работах [8-10], анализ базисного набора, состоящего из 13 спектров глобулярных белков и 6 спектров фибриллярных белков и полипептидов в Н2О в диапазоне 1800-1480 см-1, осуществляется с помощью методов "регуляризации" [4] и "ортогональных спектров" [6], рассмотренных выше.

Авторы этого метода вводят дополнительную процедуру, позволяющую исключить вклад в ИК-спектр белка поглощения боковых групп аминокислотных остатков. Ими было показано, что этот вклад составляет около 20% от суммарной интенсивности полос амид I и амид II. Возможность проведения такой процедуры определяется тем, что вклады в ИК-спектр поглощения белка от боковых групп аминокислотных остатков и полипептидного остова являются аддитивными. Для оценки поглощения боковых групп было проведено измерение ИК-спектров водных (Н2О) растворов аминокислот. Оказалось, что наиболее сильно поглощают в исследуемой части ИК-диапазона боковые группы аминокислот аспарагина, глутамина, аспарагиновой кислоты, глутаминовой кислоты, аргинина, лизина, тирозина, фенилаланина и гистидина. Было обнаружено также сильное поглощение заряженных a-амино - и a-карбоксильной групп аминокислот. Поэтому их поглощение также необходимо учитывать при анализе белкового спектра. Суммарно, ИК-спектр белка может быть представлен в следующем виде:

. (2.2.1)

 - спектр поглощения полипептидного остова белка, а  - спектр поглощения боковых групп аминокислотных остатков белка, вычисляемый по формуле

, (2.2.2)

где  - спектр поглощения k-ой аминокислоты,  - число k-ых аминокислот в белке, а  - общее число аминокислот в белке. N - и С-концевые - NH2 и - COOH группы белка также должны быть включены в эту формулу наравне с аминокислотами. Пример исключения из ИК-спектра рибонуклеазы А вклада от поглощения боковых групп аминокислотных остатков приведен на рисунке 2.2.1 Таким образом, данный метод анализа ИК-спектров полностью аналогичен методам анализа спектров КД белков, за исключением того, что в нем используются не реальные белковые спектры, а вычисленные с помощью формул (2.2.1) и (2.2.2) спектры поглощения пептидного остова белков.

Авторы метода использовали для анализа шесть типов вторичной структуры белка: упорядоченная (Ho) и неупорядоченная (Hd) формы a-спирали, упорядоченная (Вo) и неупорядоченная (Вd) формы b-структуры, b-изгиб (Т) и остальные формы (R). К неупорядоченной форме a-спирали были отнесены по два аминокислотных остатка с каждой стороны спирального сегмента, а к неупорядоченной форме b-структуры - аминокислотные остатки b-нитей, образующие "неклассические" водородные связи.

Применение к выбранному базисному набору метода "ортогональных спектров" [6] привело к получению 11 ортогональных спектров, амплитуда которых превышает экспериментальную ошибку, возникающую при регистрации ИК-спектров. Пять "наиболее значимых" ортогональных спектров показано на рисунке 2.2.2.

Экспериментальная проверка точности анализа ИК-спектров белков на белках из базисного набора дала следующие коэффициенты корреляции (смотри раздел 1.2):

Метод

Ho

Hd

Bo

Bd

T R
"регуляризации" 0.97 0.77 0.94 0.91 0.80 0.48
"ортогональных спектров" 0.98 0.80 0.93 0.90 0.75 0.48
"регуляризации" (без исключения поглощения боковых групп аминокислот) 0.92 0.68 0.85 0.90 0.53 0.32
2.3 Работа с пакетом программ STRUC по анализу ИК-спектров белков

Пакет программ STRUC разработан в институте белка РАН [10]. Он предназначен для анализа инфракрасных спектров поглощения белков и определения их вторичной структуры. Алгоритм анализа спектров основан на оригинальном методе авторов программы [8-10] (смотри выше). Пакет STRUC состоит из следующих программ и вспомогательных файлов:

-  STRUC.BAT - командный файл, используемый для определения вторичной структуры белка. Он организует работу следующих трех программ:

-  AMACIR (файл amacir.exe) - программа, исключающая из ИК-спектра поглощения белка вклад от поглощения боковых групп аминокислотных остатков по методу [8];

-  SVDIR (файл svdir.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" [6];

-  CONTIR (файл contir.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].

-  VISUAL.BAT - командный файл, предназначенный для графического воспроизведения ИК-спектра поглощения белка. Он организует работу следующих двух программ:

-  PLOTFL (файл plotfl.exe) - программа, осуществляющая преобразование спектров поглощения к формату, используемому программой PLOTNIK;

-  PLOTNIK (файл plotnik.exe) - программа, осуществляющая графическое построение ИК-спектра поглощения белка.

-  SOURCE - файл, содержащий входные данные для программы AMACIR (в том числе сам ИК-спектр поглощения белка).

-  OUT.SVD и OUT.CON - файлы, являющиеся результатом работы программ SVDIR и CONTIR, содержащие данные по оценке вторичной структуры белка соответствующими методами.

Программы, входящие в пакет STRUC, не имеют системы экранного интерфейса, и работа с ними осуществляется из командной строки. Перед началом работы с пакетом необходимо создать текстовый файл SOURCE (рекомендуется скопировать уже имеющийся) и записать в него исходные данные по исследуемому белку и его ИК-спектру поглощения, необходимые для работы программ. Формат этого файла следующий:

Номер строки Содержание
1 Идентификатор файла (длиной не более 70 символов)
2, 3 Формат записи числовых значений спектра в строках 6 - 14. По умолчанию устанавливается формат (10F6.0) - по 10 значений в каждой строке в форме действительного числа с фиксированной десятичной точкой, причем на запись всего числа отводится 6 позиций, из которых 0 позиций - на десятичную часть. (Для действительных чисел с плавающей десятичной точкой вместо символа 'F' следует записать символ 'E'.)
5

Спектральный диапазон (по волновым числам), используемый для вычислений, и число точек в спектре. Максимально допустимый спектральный диапазон составляет 1800 - 1480 см-1 при числе точек в спектре, равном 81. При задании диапазона и числа точек необходимо сохранять интервал между точками равным 4 см-1.

6 - 14

ИК-спектр поглощения белка, выраженный в единицах л моль-1·см-1.

17 Содержит единственный символ '*', положение которого определяет тип записи данных по аминокислотному составу белка: (а) NAmAc - указывается абсолютное количество остатков каждой аминокислоты в белке; (б) NAmAc/N - указывается абсолютное количество остатков каждой аминокислоты в белке, деленное на общее количество аминокислотных остатков.
19 - 40 Аминокислотный состав белка. Здесь же отдельно указываются N - и C-концевые группы белка.
42 Общее количество аминокислотных остатков в белке и значение pH, при котором снимался спектр. Указывать значение pH нужно обязательно, а общее количество аминокислотных остатков - только в том случае, если при записи аминокислотного состава белка записывались относительные доли аминокислотных остатков (вариант (б)).
43 Комментарий к файлу

Пример заполнения файла можно посмотреть в уже имеющемся файле SOURCE.

После подготовки файла SOURCE необходимо запустить вычисления. Для этого в командной строке следует ввести

STRUC SOURCE OUT.SVD OUT.CON и нажать кнопку [Enter]. (Названия файлов SOURCE, OUT.SVD и OUT.CON могут быть любыми, следует лишь соблюдать указанный порядок пр их записи.)

После окончания работы программ результаты вычислений моут быть просмотрены в файлах OUT.SVD и OUT.CON с помощью любого текстового редактора. Первая часть этих файлов содержит информацию о входных данных (взятую из файла SOURCE). Далее следует набор решений, соответствующий различным комбинациям ортогональных спектров (в файле OUT.SVD) или различным значениям параметра регуляризации (в файле OUT.CON). В конце файлов приводится аппроксимированный спектр и окончательно выбранное решение.

Можно просмотреть также промежуточные результаты вычислений программ. Файл PEPT, создаваемый программой AMACIR, содержит ИК-спектр поглощения пептидной цепи. Этот файл является входным для программ SVDIR и CONTIR. Файл AMACIR.RES, также создаваемый программой AMACIR, содержит данные об ионизации отдельных аминокислотных остатков при заданном значении pH, среднем значении массы одного аминокислотного звена данного белка, содержании в белке азота, а также три ИК-спектра поглощения: спектр белка (определенный экспериментально) и спектры боковых групп аминокислотных остатков и пептидной цепи (вычисленные программой AMACIR).

Для того, чтобы построить все три спектра на экране, необходимо запустить файл VISUAL.BAT.

В появляющемся после этого на экране главном меню программы PLOTNIK следует выбрать пункт Suit, позволяющий перейти в раздел задания параметров, необходимых для построения графиков. Ниже перечислены основные из них:

Titles/X

Titles/Y

Scale/X/Upper

Scale/X/Lower

Scale/Y/Upper

Scale/Y/Lower

Misc/Npts

Misc/Data

Волновое число, 1/см

Коэффициент молярной экстинции, 1/ (моль см)

1480

1800

Auto

Auto

Auto

Formatted

Для одновременного построения трех графиков необходимо задать три набора данных (A, B и C) и указать имена файлов, содержащих эти данные:

Set Legend Filename

A

B

C

экспериментальный спектр

спектр поглощения пептидной цепи

спектр поглощения а/к остатков

buf1.dat

buf2.dat

buf3.dat

Файлы buf1.dat, buf2.dat и buf3.dat создаются программой PLOTFL на основе данных файла AMACIR.RES (эти файлы уничтожаются после завершения работы программы PLOTNIK). После задания параметров следует вернуться в главное меню программы PLOTNIK и выбрать в нем пункт View. При этом на экране будут построены требуемые графики.


Список литературы

1.  Кантор Ч., Шиммел П. Биофизическая химия. Том 2: Методы исследования структуры и функции биополимеров. М: Мир, 1984

2.  Saxena V.P., Wetlaufer D.B. (1971) A new basis for interpreting the circular dichroic spectra of proteins. Proc. Natl. Acad. Sci. U.S.A.68, 969-972

3.  Сhang C.T., Wu C. -S.C., Yang J.T. (1978) Circular dichroic analysis of protein conformation: inclusion of the b-turns. Anal. Biochem.91, 13-31

4.  Provencher S.W., Glockner J. Estimation of globular protein secondary structure from circular dichroism. (1981) Biochemistry 20, 33-37

5.  Hennessey J.P., Jr., Johnson W.C., Jr. (1981) Information content in the circular dichroism of proteins. Biochemistry 20, 1085-1094

6.  Compton L.A., Johnson W.C., Jr. (1986) Analysis of protein circular dichroism spectra for secondary structure using a simple matrix multiplication. Anal. Biochem.155, 155-167

7.  Manavalan P., Johnson W.C., Jr. (1987) Variable selection method improves the prediction of protein secondary structure from circular dichroism spectra. Anal. Biochem.167, 76-85

8.  Venyaminov S.Yu., Kalnin N.N. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions.I. Spectral parameters of amino acid residue absorption bands. Biopolymers 30, 1243-1257

9.  Venyaminov S.Yu., Kalnin N.N. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions. II. Amide absorption bands of polypeptides and fibrous proteins in a-, b-, and random coil conformations. Biopolymers 30, 1259-1271

10.  Kalnin N.N., Baikalov I.A., Venyaminov S.Yu. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions. III. Estimation of the protein secondary structure. Biopolymers 30, 1273-1280


Страницы: 1, 2, 3, 4


ИНТЕРЕСНОЕ



© 2009 Все права защищены.