Главная страница «Первого сентября»Главная страница журнала «Химия»Содержание №11/2008

ЛЕТОПИСЬ ВАЖНЕЙШИХ ОТКРЫТИЙ

 

 

СОЗДАНИЕ QSAR

В 1964 г. в журнале Американского химического общества была опубликована статья Корвина Ганча, посвященная методологии поиска количественных зависимостей биологической активности веществ от их химической структуры. Эта методология получила название QSAR. Работа Ганча положила начало широкому использованию математических методов в рациональном создании лекарственных препаратов.

 

Я уверен, что наступит время, когда книги,
называемые нами «Фармакопеи», будут построены
на основе рассуждений, и когда химик и врач будут
действовать заодно.

Б.Ричардсон, 1869 г.

 

С древнейших времен в качестве источника лекарственных препаратов использовалось растительное или животное сырье. Уже в средние века получила широкое распространение идея применения химических (главным образом неорганических) веществ для лечения заболеваний. Во второй половине XIX в. благодаря созданию структурной теории и быстрому развитию органической химии произошла подлинная революция в химии лекарств – появились и нашли применение чисто синтетические препараты. Традиционный путь поиска лекарственных веществ в XX в. заключался в синтезе самых разнообразных типов органических соединений и их тестировании на различные виды активности. Были синтезированы и протестированы сотни тысяч веществ. Трудоемкость и длительность этого процесса заставляла ученых задумываться над разработкой теоретических основ поиска лекарств, и главным образом – над проблемой ограничения количества синтезируемых соединений. Постепенно возникали подходы не только к выявлению взаимосвязи биологических свойств веществ с их структурой, но и к количественному описанию этой взаимосвязи. Подобные исследования привели к рождению целого научного направления, называемого в современной химии лекарств QSAR («Quantitative Structure – Activity Relationship», или «количественное соотношение структура–активность»).

QSAR – это математический аппарат, позволяющий проводить корреляции между структурами химических соединений и их биологической активностью. Важная задача QSAR заключается в идентификации и количественном выражении структурных параметров или физико-химических свойств молекул с целью выявления факта влияния каждого из них на биологическую активность. Если такое влияние имеет место, то возможно составление уравнений, позволяющих просчитать заранее активность новых соединений и сократить количество синтезируемых веществ. Методология QSAR сформировалась к середине 1960-х гг. Ее основателем во многих литературных источниках считается американский ученый Корвин Ганч, хотя в ее создание существенный вклад внесли и такие ученые, как Ч.Овертон, Г.Мейер, Г.Фюнер, С.Фри, Дж.Вильсон, Т.Фуджита и др.

Идея о существовании математической зависимости между структурой и биологическими свойствами соединений была высказана еще во второй половине XIX в. В 1869 г. А.Крум-Браун и Т.Фрезер, исследуя токсическое действие различных алкалоидов (стрихнина, кодеина, морфина, никотина) и продуктов их метилирования (рис. 1), показали, что такое «незначительное» структурное изменение, как введение метильной группы к атому азота, вызывает существенное уменьшение токсичности алкалоидов. Крум-Браун и Фрезер пришли к выводу, что физиологическая активность (Ф) должна быть функцией химической структуры (С), и опубликовали уравнение, которое считается первой общей формулировкой количественной зависимости структура–активность:

Ф = f(С).

Рис. 1. Метилирование алкалоидов (на примере морфина)

Рис. 1.
Метилирование алкалоидов (на примере морфина)

Стали появляться и другие работы, в которых предпринимались попытки найти количественные выражения зависимости физиологической активности от химической структуры. Так, в том же 1869 г. Б.Ричардсон обнаружил, что в гомологических рядах спиртов жирного ряда концентрации веществ, вызывающих наркоз (отсутствие реакции на внешние раздражители) у животных, уменьшаются пропорционально увеличению количества атомов углерода в их молекулах. С.Бинц в 1880-х гг. вывел заключение о возрастании наркотического действия с увеличением количества атомов хлора в ряду CH4, CH3Cl, CH2Cl2, CHCl3, CCl4. Было установлено также, что снотворное действие некоторых сульфосодержащих соединений возрастает с увеличением количества этильных групп в их молекулах. Поиски подобных закономерностей, связывающих биологическую активность с количеством определенных атомов или групп, продолжались и в XX в. Можно привести довольно много примеров, однако подавляющее большинство этих закономерностей имели существенные ограничения и оказывались справедливыми лишь для очень небольших рядов соединений. Возникла необходимость привлечения каких-то других параметров для построения корреляций структура–свойство, и в дальнейшем существенно более плодотворными оказались попытки искать зависимости биологической активности веществ от их физико-химических свойств (которые в свою очередь зависят от химической структуры).

В конце XIX – начале XX в. появилась серия работ М.Рише, Ч.Овертона и Г.Мейера, в которых были обнаружены количественные корреляции между различными физико-химическими параметрами молекул и их токсичностью, а также способностью вызывать наркоз и местную анестезию. В 1893 г. Рише получил количественную зависимость токсичностей этилового спирта, диэтилового эфира, «экстракта полыни» и других веществ от их растворимостей в воде. В проводимых им экспериментах рыбки весом 2–5 г помещались в 1–1,5 л воды, содержащей измеренное количество исследуемого соединения, и определялась доза последнего, которая позволяла жить этим рыбкам в течение определенного времени. На основании полученных результатов Рише сделал заключение: чем более соединение растворимо, тем менее оно токсично.

Овертон через несколько лет после работ Рише, проанализировав наркотическое действие более 130 коммерчески доступных органических веществ на многочисленные растительные и животные объекты (водоросли, головастики, рыбы и др.), получил линейные зависимости между их активностью и липофильностью (способностью растворяться в жирах). В качестве меры последней он использовал коэффициент распределения вещества в системе оливковое масло–вода (т.е. соотношение концентраций вещества в липидной и водной фазах). Полученные результаты привели Овертона к выводу о том, что явление наркоза следует приписать к чисто физическим изменениям, вызванным растворением органических веществ в липидных компонентах животных и растительных клеток. К аналогичным выводам пришел и Мейер в 1899 г.

Работы Ричардсона, Рише и Овертона стимулировали появление в начале XX в. ряда исследований по построению зависимостей величин биологической активности от самых разнообразных физико-химических параметров. Например, Дж.Холт и В.Мур показали, что для тараканов и домашних мух токсичность паров жидкостей увеличивалась с увеличением их температуры кипения вплоть до определенной величины (около 225 °С). Более высококипящие соединения (225–250 °С) были настолько малолетучими, что гибель мух наблюдалась только после очень длительного нахождения в их парах, а соединения с температурами кипения выше 250 °С оказались нетоксичны.

Важные работы по изучению влияния физико-химических свойств веществ на биологическую активность были сделаны русским ученым Николаем Васильевичем Лазаревым. В начале 1940-х гг. (в блокадном Ленинграде) он проанализировал значения токсичностей и коэффициентов распределения в системе оливковое масло–вода для тысячи органических соединений. Лазарев построил графические корреляции, используя двойную логарифмическую шкалу, что позволило наблюдать линейные зависимости логарифмов коэффициентов распределения от логарифмов концентраций веществ, вызывающих тот или иной токсический эффект, например остановку изолированного сердца лягушки, раздражение кожных покровов животных.

В 1950-х гг. методология поиска корреляций между структурой и биологической активностью стала интенсивно развиваться благодаря исследованиям, целью которых было изучение вкладов отдельных заместителей в биологическую активность. Отметим, что еще в 1907 г. Г. Фюнер, изучавший задержку развития яиц морских ежей под влиянием одноатомных спиртов жирного ряда, обнаружил, что в пределах гомологических серий каждый следующий член ряда действовал приблизительно втрое сильнее, чем предыдущий, что явилось первым количественным свидетельством аддитивности вкладов отдельных структурных фрагментов в значение активности.

Важным достижением середины XX в. по созданию корреляций, основанных на определении вкладов заместителей в данный вид активности, являются исследования С.Фри и Дж.Вильсона (1964). В предложенном ими методе биологическая активность определяется как сумма вкладов, вносимых каждым заместителем в каждом положении, и никакие физико-химические характеристики молекул при этом не привлекаются. Так, для серии гипотетических соединений (рис. 2, соединения 1, 2, 3), активность (А) будет определяться уравнением:

А = Ki,

где Ki – вклад заместителя Ri, находящегося в положении i. При отсутствии заместителя в данном положении K = 0, при его наличии k = 1.

Константы, выражающие влияние на активность каждого заместителя в каждой позиции, определяют на основании экспериментальных данных (в нашем гипотетическом примере – на основании значений активностей соединений 1, 2 и 3) и подставляют их в уравнение. Полученное уравнение может быть использовано для вычисления активности лишь тех новых соединений рассматриваемого ряда, которые содержат заместители, по природе и положению идентичные заместителям уже исследованных соединений (например, в нашем случае (см. рис. 2) – для соединений 4, 5, 6). Часто, однако, таким образом удается рассчитать активность довольно большого числа новых структур.

Рис. 2. Серия гипотетических соединений, иллюстрирующая возможности теоретического расчета биологической активности

Рис. 2.
Серия гипотетических соединений, иллюстрирующая
возможности теоретического расчета
биологической активности

Помимо таких чисто эмпирических методов в середине XX в. были предприняты попытки использовать в корреляционных уравнениях параметры, учитывающие липофильность соединений, а также электронные и стерические эффекты заместителей. В 1964 г. Корвин Ганч опубликовал в журнале Американского химического общества свою работу «–анализ. Метод корреляции биологической активности и химической структуры», которая впоследствии получила такой высокий индекс цитирования, что была названа Международным институтом научной информации «классической работой». 1964 год условно считается годом рождения современной методологии QSAR.

Заслугой Корвина Ганча явились следующие важные идеи. Во-первых, он предложил скомбинировать в одном уравнении сразу несколько структурных параметров, характеризующих электронные, стерические и гидрофобные свойства молекулы. Во-вторых, для нелинейных соотношений липофильность – активность Ганч предложил параболическую модель. Он заключил, что для связывания с молекулами-мишенями лекарственные соединения должны иметь возможность, с одной стороны, циркулировать в кровотоке (т.е. быть растворимыми в воде), а с другой стороны – проникать через мембраны клеток (т.е. растворяться в жирах). В таком случае активность веществ с очень маленьким или очень большим коэффициентом распределения (т.е. очень гидрофильных или очень липофильных) будет незначительной, т.к. они либо не смогут пройти через липидные мембраны, либо будут захвачены жировой тканью. Это означает, что зависимость активности от коэффициента распределения будет в общем случае представлять собой параболическую кривую, имеющую максимум. Подобные зависимости Ганч предложил описывать уравнениями, содержащими вторую степень. В общем виде предложенное им корреляционное уравнение для данного вида активности в данном ряду химических соединений имеет вид:

lg(1/c) = a0 + a1lgPa2(lgP)2 + a3 + a4Es,

где с – любая экспериментальная величина, характеризующая биологическую активность, Р – коэффициент распределения вещества между липидной и водной фазами (Ганч использовал систему октанол–вода), параметры и Es отражают соответственно электронные и стерические влияния заместителей, ai – постоянные, полученные при обработке экспериментальных данных методом наименьших квадратов. В частных случаях один или несколько коэффициентов ai могут принимать нулевое значение, тогда величина lg(1/c) зависит от меньшего числа параметров. Например, биологический ответ живого организма может определяться только гидрофобными характеристиками вещества, в то время как его электронные и стерические параметры могут не играть существенной роли, и наоборот.

Основной характеристикой липофильности молекулы, используемой в корреляционных уравнениях, является логарифм коэффициента распределения в системе октанол–вода. Одна из идей Ганча заключалась в том, что эту величину можно представить как сумму введенных им величин , характеризующих вклад в липофильность отдельных атомов или фрагментов структуры. Очевидно, что параметр имеет отрицательные значения для гидрофильных групп (например, для карбоксила) и положительные – для гидрофобных групп (например, для метила). Важность этой идеи заключается в том, что, суммируя определенные экспериментальные значения для структурных фрагментов данного соединения, можно получить расчетную величину lgP и в ряде случаев оценить биологическую активность молекул до их синтеза. Например, при создании снотворных средств имеет смысл рассчитать теоретические значения логарифма коэффициента распределения для серии перспективных соединений и синтезировать только те, для которых
lgP 2, т.к. именно это значение является для них оптимальным.

В настоящее время подход Ганча получил свое развитие и широко используется для поиска корреляций между биологической активностью, липофильностью и другими молекулярными характеристиками. Корреляционные соотношения чрезвычайно важны для предсказания структурных модификаций химических соединений, способствующих повышению их биологической активности. Именно в этой предсказательной силе и заключается основная ценность методологии QSAR – необходимого инструмента для рационального синтеза лекарственных препаратов.

* * *

Корвин ГАНЧ* (Corwin Hansch) – американский химик-органик. Родился 6 октября 1918 г. в г. Кейнмаре (шт. Северная Дакота, США). Закончил Иллинойский университет (Чикаго) в 1940 г., после чего работал над кандидатской диссертацией в Университете Нью-Йорка, защитил ее в 1944 г. Некоторое время работал в компании «Дюпон» в Ричланде и в Вилмингтоне (шт. Делавар), а также в университете в Чикаго. В 1946 г. стал сотрудником химического отделения колледжа Помона в Клэрмонте (Pomona College, Claremont), где работает до сих пор. Корвин Ганч женат (с 1944 г.), в семье двое детей – сын (1954) и дочь (1958).

Начальные научные исследования Ганча были посвящены изучению реакций высокотемпературной каталитической дегидроциклизации, однако основной областью деятельности является разработка методов поиска количественных соотношений между биологической активностью и химической структурой. Ученый считается одним из главных основателей дисциплины QSAR. Он автор более 300 публикаций, в том числе нескольких монографий. Ряд книг других авторов посвящен Корвину Ганчу в знак признания его выдающихся научных заслуг. По данным Института научной информации Ганч является одним из наиболее цитируемых ученых всего мира.

В 2000 г. Международное общество химической информатики и QSAR (основано в 1989 г.) учредило в честь К.Ганча, почетного председателя общества, специальную награду, которая вручается ежегодно на европейском симпозиуме по QSAR.

Л и т е р а т у р а

Зефирова О.Н., Палюлин В.А. История QSAR. Ранние исследования количественной связи между структурой и биологической активностью органических соединений; История QSAR. Работы Н.В.Лазарева о количественной связи между структурой органических соединений и их биологической активностью. В кн.: История химии: область науки и учебная дисциплина. Под ред. В.В.Лунина и В.М.Орла. М.: Изд-во МГУ, 2001, с. 60–73, 74–81.


* Такой перевод фамилии утвердился в русскоязычной литературе, хотя в некоторых источниках встречается более правильный вариант – Ханш или Хэнш.

О.Н.ЗЕФИРОВА