| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
МЕНЮ
| Учебное пособие: Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белковЭту проблему частично можно разрешить, заменив метод наименьших квадратов моделью, применение которой, на первый взгляд, не вполне оправдано и адекватно, но зато приводит к устойчивому к экспериментальной ошибке результату даже в случае большого числа параметров. Применение такой стабилизирующей модели позволяет подойти к анализу спектров КД с другой стороны. А именно, появляется возможность прямого представления спктра КД исследуемого белка в виде линейной комбинации базисных спектров. Таким образом удается полностью избежать проблемы, связанной с определением эталонных спектров отдельных структурных классов и проводить более гибкий и точный анализ с использованием реальных белковых спектров. Рассмотрим данный метод более подробно. Предположим, что нам
удалось представить спектр КД исследуемого белка в виде линейной комбинации спектров
где Обозначим долю аминокислот j-ого базисного белка в i-ом
структурном классе через
Аналогично для спектра КД исследуемого белка:
Подставляя равенства (1.2.10) и (1.2.11) в уравнение (1.2.9),
получим связь искомых коэффициентов
Проблема заключается в определении коэффициентов
с ограничениями
Здесь Согласно теореме Гаусса-Маркова, среди линейных несмещенных оценок
оценка, получаемая с помощью метода наименьших квадратов, является наиболее эффективной
в том смысле, что рассчитанные с его помощью коэффициенты Авторы метода [4] нашли выход в использовании вместо метода наименьших квадратов линейной смещенной оценки, определяемой следующим условием:
Эта оценка является смещенной и, следовательно, приводит к систематической
ошибке. Тем не менее при больших значениях Рассмотрим критерий (1.2.15) более подробно. При a=0 мы получаем обычный метод наименьших квадратов,
не пригодный в нашем случае. При a>0
второй член в левой части (1.2.15) является регуляризатором. Он стабилизирует решение,
поддерживая коэффициенты При возрастании параметра a
точность аппроксимации экспериментальных данных падает за счет уменьшения эффективного
числа степеней свободы, соответствующего числу свободных параметров в обычном методе
наименьших квадратов. Обычно при малых a
это происходит медленно, но когда этот параметр становится слишком большим, число
степеней свободы становится таким малым, что коэффициенты Если при анализе спектра КД белка нам известно, что среди белков
базисного набора есть белки, структурно схожие с исследуемым, то в уравнение (1.2.15)
можно ввести эти данные с помощью различного взвешивания отдельных членов второй
суммы этого уравнения, тем самым давая соответствующим коэффициентам Метод "ортогональных спектров" [5,6]. Основой данного метода является метод собственных векторов многокомпoнентного матричного анализа. Он позволяет проводить быструю обработку больших наборов данных с помощью формирования из них ортогональных компонент в виде собственных векторов с соответствующими собственными значениями. Этот метод использует в качестве базисных спектры КД 16 белков
с известной вторичной структурой в диапазоне 178-260 нм с интервалом в 2 нм (всего
по 42 точки в каждом из 16 спектров). Пусть С - прямоугольная матрица размером
16 (CCT) U = UE. (1.2.16) Матрица U будет состоять из 16 собственных векторов, а диагональная матрица Е - из 16 собственных значений матрицы CCT. Рассмотрим матрицу B, определяемую выражением B = UTC. (1.2.17) Это прямоугольная матрица, которая, также как и матрица исходных
спектров КД базисных белков, имеет размер 16 Ошибка, возникающая при аппроксимации экспериментального белкового спектра КД с помощью неполного набора наиболее “значимых" ортогональных базисных спектров, определяется следующей формулой:
Здесь s - среднее квадратичное
отклонение, n - число точек в спектре, m - число базисных спектров в исходном наборе,
Из приведенной таблицы видно, что четыре ортогональных базисных спектра дают значение s, нe превышающее уровень случайной ошибки. Но эксперименты показывают, что форма реконструированного таким образом спектра плохо совпадает с реальной. Пять ортогональных базисных спектров дают значение s, в два раза меньшее уровня случайной ошибки, и при этом хорошо воспроизводят форму спектра. Шесть ортогональных базисных спектров дают лишь незначительное улучшение. Это объясняется тем, что оставшиеся базисные спектры представляют собой ни что иное, как “шум”, и их учет приводит лишь к увеличению ошибки при вычислениях. Авторы данного метода использовали для вычислений пять "наиболее значимых" ортогональных базисных спектров (m=5), полагая это количество оптимальным. Эти спектры представлены на рисунке 1.2.2. Из выражения (1.2.17) следует, что С = UB. (1.2.19) Восстанавливая по сокращенному набору ортогональных базисных спектров исходный набор базисных спектров КД, можем написать:
где Представим данные рентгеноструктурного анализа для 16 базисных
белков в виде матрицы S размером 16 Как можно предполагать из того факта, что исходный набор базисных спектров может быть полностью восстановлен но основе лишь пяти спектров ортогонального базисного набора, спектры КД белков в диапазоне от 178 до 260 нм содержат в себе информацию лишь о пяти независимых типах вторичной структуры. С точки зрения независимости спектров КД в качестве таких типов вторичной структуры могут быть приняты комбинации обычных типов вторичной структуры (a-спирали, b-структуры и т.д.), соответствующие пяти "наиболее значимым" ортогональным базисным спектрам. Если для ортогональных базисных спектров также ввести матрицу
структурных данных D (16 S = UD (1.2.21) Как показывает эксперимент, структурная матрица S может быть полностью восстановлена на основе лишь пяти комбинаций элементов вторичной структуры матрицы D, соответствующих пяти "наиболее значимым" ортогональным базисным спектрам. Таким образом, эти комбинации обычных типов вторичной структуры являются (с точки зрения независимости спектров КД) независимыми вторичными "суперструктурами":
Следовательно, восемь рассматриваемых в данном методе стандартных структурных классов, вообще говоря, не являются строго независимыми, так как все они также могут быть описаны с помощью пяти независимых “суперструктур”, описанных выше. |
ИНТЕРЕСНОЕ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|