현재 위치 - 편방대전넷 - 중약재료 - 가상 의학 연구에서 대형 데이터 마이닝에 대한 고찰

가상 의학 연구에서 대형 데이터 마이닝에 대한 고찰

가상 의학 연구에서 대형 데이터 마이닝에 대한 고찰

1. 빅 데이터 마이닝을 기반으로 한 가상 의학 연구 사례

데이터 마이닝은 오늘날까지 발전해 왔으며, 현재의 개념에 따르면' 큰' 데이터 마이닝의 시대여야 한다. 먼저 몇 가지 관련 사례를 말씀드리겠습니다.

1. 1 가상 임상 시험-대용량 데이터 수집

먼저 이런 사례를 살펴보겠습니다. 20 1 1 년 6 월, 화이자 제약유한공사는' 가상' 임상연구를 발표했습니다. 미국 식품의약청에서 승인한 시범프로젝트이며 이니셜은' REMOTE' 입니다. "원격" 프로젝트는 미국 최초의 환자가 휴대폰과 인터넷만 사용하면 되는 것이지, 병원에 반복적으로 가는 임상 연구가 아니다. 이 프로젝트의 목표는 이런' 가상' 임상 연구가 전통적인 임상 연구와 같은 결과를 낼 수 있는지 확인하는 것이다. 전통적인 임상 연구에서는 환자가 병원 근처에 살면서 정기적으로 병원이나 진료소에 가서 1 차 검사와 여러 차례 후속 검사를 받아야 한다. 이 프로젝트가 효과적이라면 미국 전역의 환자들이 앞으로 많은 의학 연구에 참여할 수 있다는 의미일 수 있다. 그 결과, 원래 과학 연구 프로젝트에 충분히 대표되지 않았던 집단이 참여할 수 있게 되고, 데이터 수집 속도가 크게 빨라지고, 비용도 크게 낮아질 것이며, 참가자가 탈퇴할 확률도 크게 낮아질 것이다.

위의 예에서 볼 수 있듯이 인터넷을 통해 많은 환자의 임상 데이터를 수집할 수 있습니다. 이는 전통적인 임상 연구 샘플의 수보다 훨씬 크며, 일부 임상 데이터는 좀 더 편리한 착용 가능한 건강 모니터링 장비에서 나올 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 건강명언) 이런 연구를 진행하면 과학연구 설계가 엄격하고, 품질기준이 효과적으로 집행되고, 각종 오차가 효과적으로 통제되는 조건 하에서 과학연구의 효율성과 성과의 신뢰성을 크게 높일 수 있다. 화이자의 수석 의료관으로서, 프레다? 루이스 홀은 이렇게 말합니다. "더 많은 사람들을 연구에 참여시키면 의학적 진보를 촉진하고 더 많은 환자에게 더 나은 치료 효과를 가져다 줄 수 있다."

1.2 가상 약물 임상 시험-대용량 데이터 마이닝

다른 사례를 살펴 보겠습니다. 1992, 항우울제 파록세틴 (파록세틴) 출시 승인; 65438 에서 0996 까지 콜레스테롤 저하제 프라바올이 정식으로 출시되었다. 두 제약 공장의 연구는 각 약을 단독으로 복용하는 것이 효과적이고 안전하다는 것을 증명했다. 하지만 환자가 두 가지 약을 동시에 복용하는 것이 안전한지 아무도 모른다. 심지어 이 문제에 대해 생각해 본 사람은 거의 없다. 미국 스탠퍼드 대학교의 연구원들은 데이터 마이닝 기술을 이용하여 수만 명의 환자의 전자 의료 기록을 분석한 결과, 두 가지 약물을 동시에 복용하는 환자의 혈당 함량이 더 높다는 예상치 못한 답을 발견했다. 이것은 당뇨병 환자에게 큰 영향을 미치며, 혈당이 너무 높으면 그들의 건강에 심각한 위협이 된다! 과학자들은 또한 혈당 검사 결과와 약물 처방을 분석하여 잠정적인 규칙을 찾는다.

한 명의 의사에게 이 두 가지 약을 동시에 복용하는 환자의 수는 매우 제한적이다. 소수의 당뇨병 환자들이 혈당이 이상하게 상승할 수도 있지만, 파록세틴과 푸와올을 동시에 복용하는 환자의 결과라는 사실을 의사들은 깨닫기 어렵다. (빌 게이츠, 당뇨병, 당뇨병, 혈당, 혈당, 혈당, 혈당, 혈당) 이것은 큰 데이터에 숨겨져 있는 보이지 않는 법칙이기 때문에 파록세틴과 프라고의 합동약의 안전성을 전문적으로 연구하는 사람이 없다면, 한 명의 의사가 이 법칙을 밝히기가 매우 어렵다. 그러나 수천 가지의 임상 약물이 있습니다. 우리는 어떻게 두 가지 혹은 세 가지 약물의 임의 조합의 안전과 유효성을 연구할 수 있습니까? 데이터 마이닝은 다양한 약물의 공동 응용을 탐구하는 효과적이고 신속하며 능동적인 방법이 될 가능성이 높습니다!

연구원들은 환자에게 전화를 걸어 임상 실험을 할 필요가 없다. 그렇게 하면 비용이 너무 많이 든다. 전자 병력과 컴퓨터 응용의 보급은 의료 데이터 마이닝을 위한 새로운 기회를 제공한다. 과학자들은 더 이상 자원 봉사자를 소집하여 연구를 하는 전통적인 것에 국한되지 않고, 일상생활의 실험에서 많은 수의 일상적인 임상 사례와 같은 데이터를 더 많이 선택하여 가상 연구를 실시한다. (윌리엄 셰익스피어, 윈스턴, 과학명언) 이것들은 계획 프로젝트의 실험 데이터가 아니라 많은 병원의 병력에 보관되어 있다.

이 사례와 마찬가지로, 데이터 기술의 응용 프로그램을 통해 연구원들은 약이 상장될 때 예측할 수 없는 문제 (예: 약이 특정 사람들에게 어떤 영향을 미칠 수 있는지) 를 발견할 수 있습니다. 또한 의료 기록에 대한 데이터 마이닝은 연구에 도움이 될 뿐만 아니라 의료 서비스 시스템의 효율성을 높일 수 있습니다.

1.3 가상 약물 표적 발견-지식 발견

이런 종류의 연구를 다시 살펴 보겠습니다. 보통 신약 연구 개발 과정은 비교적 길고, 투입이 크며, 위험이 높다. 신약 개발 평균 시간은 KLOC-0/5 년, 평균 8 억 달러가 넘는 것으로 집계됐다. 하지만 약물의 효능이 떨어지고 부작용이 크기 때문에, 많은 의약품의 연구 개발은 종종 임상 단계에서 실패를 선언하여 막대한 경제적 손실을 초래한다. 약물 개발의 원천으로서 약물 표적의 발견과 식별은 약물 연구 개발의 성공률에 매우 중요한 역할을 한다. 생물 정보학 기술의 지속적인 발전으로 프로테오믹스 및 화학 유전학의 데이터가 증가하고 있으며, 데이터 마이닝 기술을 전통적인 생물 실험 기술과 결합하여 신약 표적 발견을위한 새로운 기술적 수단을 제공하고 표적 인식 및 예측을위한 새로운 방법을 제공 할 수 있습니다. 약물 표적 데이터베이스 구축, 지능형 컴퓨팅 기술 및 데이터 마이닝 기술을 사용하여 기존 약물 표적 데이터를 심층적으로 탐구하여 새로운 약물 표적이 바로 이런 연구라는 것을 발견하는데, 이를 약물 표적 지식 발견이라고도 합니다.

전통적인 약물 표적의 발견은 보통 대량의 반복적인 생화학 실험을 통해 이루어지는데, 비용이 많이 들고 비효율적이며 성공률이 낮기 때문에 맹인이 코끼리를 만지는 것처럼 방향을 파악하기가 어렵다. 데이터 마이닝이라는 자동적이고, 능동적이며, 효율적인 탐색 기술을 적용함으로써 가상 약물 표적 발견을 할 수 있으며, 약물 표적 발견 과정을 크게 가속화할 뿐만 아니라 생화학 실험의 횟수와 비용을 크게 줄여 전통적인 생화학 실험의 성공률을 높였다.

가상 의학 연구에서 데이터 마이닝의 적용.

빅 데이터 시대에 R&D 제약은 더 많은 도전과 기회에 직면해 있다. R&D 비용을 더 잘 절약하고 신약 연구의 성공률을 높이고 경쟁력 있는 신약을 개발하기 위해 데이터 마이닝 기술을 적용하여 가상의학 연구와 약물 연구를 실시할 수 있다. 가상 의학 연구에서 데이터 마이닝의 응용은 다음과 같이 요약할 수 있다.

2. 1 예측 모델링을 통해 제약 회사는 R&D 비용을 절감하고 R&D 효율성을 높일 수 있습니다. 이 모델은 약물 임상 실험 단계 이전의 데이터 세트와 임상 초기 데이터 세트를 기반으로 하며 가능한 한 빨리 임상 결과를 예측할 수 있습니다. 평가 요소에는 제품 안전, 유효성, 잠재적 부작용 및 전체 테스트 결과가 포함됩니다. 예측 모델링은 의약품 회사의 R&D 비용을 낮출 수 있다. 데이터 모델링 및 분석을 통해 약물의 임상 결과를 예측한 후, 2 차 우수 약물에 대한 연구를 일시 중지하거나 2 차 우수 약물에 대한 값비싼 임상 실험을 중지할 수 있습니다.

2.2 환자 데이터 마이닝을 통해 모집된 환자가 실험 조건을 충족하는지 평가함으로써 임상 실험 과정을 가속화하고 보다 효과적인 임상 실험 설계 건의를 제시한다. 예를 들어, 환자 집단을 클러스터링하여 나이, 성별, 병세, 실험실 지표 등의 특징을 찾아낼 수 있습니다. , 테스트 조건이 충족되었는지 여부를 판단하고 이러한 특성에 따라 대조군을 더 잘 설정할 수 있습니다.

2.3 임상 실험 데이터와 환자 병력 분석을 통해 약물의 더 많은 적응증을 확인하고 부작용을 발견할 수 있다. 임상 실험 데이터와 환자 기록을 분석한 후, 약물은 다른 적응증에 대해 재배치되거나 상장될 수 있다. 관련성 분석 등의 방법을 통해 실험 데이터를 발굴하면 예상치 못한 결과가 발견되어 데이터 활용도가 크게 향상될 수 있습니다.

2.4 실시간 또는 거의 실시간으로 불량반응 보고서를 수집하면 약물 경계를 촉진할 수 있다. 약물 경고는 상장약의 안전보장체계로 약물 불량반응을 모니터링, 평가 및 예방한다. 클러스터링, 상관 관계 등 데이터 마이닝 수단을 통해 약품의 불량반응 상황, 약표현, 질병 및 불량반응, 어떤 화학성분과 관련이 있는지 등을 알 수 있다. 예를 들어 불량반응 증상의 클러스터 분석, 화학성분과 불량반응 증상의 상관관계 분석 등이 있다. 또한, 경우에 따라, 임상 시험은 이미 몇 가지 상황을 암시했지만, 그것들을 증명할 충분한 통계가 없다. 현재 임상 실험 빅데이터를 기반으로 한 분석은 증거를 제시할 수 있다.

2.5 표적 약물 개발: 게놈 데이터와 같은 대형 데이터 세트를 분석하여 맞춤형 약물을 개발합니다. 본 신청은 유전적 변이, 특정 질병에 대한 감성, 특정 약물에 대한 반응 사이의 관계를 고찰한 뒤 약물 개발과 약물 치료 과정에서 개인의 유전적 변이 요인을 고려했다. 많은 경우, 환자는 같은 약물 방안을 사용하지만 효능은 다르다. 부분적으로는 유전자 변이 때문이다. 같은 질병을 앓고 있는 환자마다 다른 약을 개발하거나 다른 용법을 제시한다.

2.6 약물의 화학성분과 약리작용의 결합을 탐구하여 R&D 인원의 영감을 불러일으켰다. 예를 들어 한약의 연구 개발을 위해 데이터 마이닝을 이용하여 한약의 처방과 증상을 분석하고, 처방과 증상의 관계를 탐구하고, 효능, 귀경, 약성, 약미 등에서 분류 특징을 분석한다.

가상 약물 임상 시험 분석 시스템

점점 더 많은 임상 연구 및 약물 임상 실험이 엄격한 조건 필터링을 통해 일상적인 임상 업무에서 생성되는 큰 데이터에서 데이터를 추출하고 있습니다. 본 문서 1. 1 및 1.2 에서 언급한 사례처럼, 소위 가상 약물 임상 실험은 대량의 병원 전자 의료 기록에서 광범위한 임상 데이터를 수집하여 설계 요구 사항에 따라 엄격한 조건을 미리 선별하는 것입니다. 전통적인 방법보다는 가상 방법이지만, 이러한 약물 임상 실험 연구 샘플은 더 광범위하고, 비용이 저렴하며, 효율이 높고, 연구 성과가 많다. 가상 연구의 방법은 전통적인 약물 임상 연구를 완전히 대체할 수도 있고, 일부 전통 약물 임상 연구에 대한 사전 실험이나 탐구성 연구로 실제 약물 임상 연구가 더 빠르고, 좋고, 성할 수 있도록 할 수도 있다. 이제 가상 약물 임상 실험 분석 시스템이 어떻게 작동하는지 살펴보겠습니다.

3. 1 가상 약물 연구의 기본 아이디어

1, 약물 임상 실험 데이터웨어 하우스 구축, 임상 데이터 및 약물 응용 데이터 통합 및 축적 2. 약물 임상실험에서 관찰팀과 대조군 샘플의 설계와 선택. 3. 데이터 마이닝 기술을 이용하여 약물이 질병 치료에 미치는 효과와 부작용을 탐구한다. 4. 통계 기술을 이용하여 약물 임상 시험의 효과를 추론하고 평가한다.

3.2 약물 임상 데이터웨어 하우스 구축

약물 임상 시험 데이터웨어 하우스를 구축하는 방법에는 두 가지가 있습니다. 한 가지 방법은 고전적인 약물 임상 실험 설계를 통해 관련 데이터를 사용자 정의하고 수집하는 것입니다. 전통적인 방법은 주로 종이 문서 기록이며, 전용 데이터 입력 소프트웨어도 있다. 이 방법으로 수집한 데이터는 미리 설계되어 약물 임상 실험에 대한 특수한 데이터를 직접 형성하지만, 일반적으로 샘플 데이터는 그리 크지 않습니다. 또 다른 하나는 병원에서 대량의 역사적 임상 약물 데이터를 추출, 변환, 로드한 다음 축적된 다른 임상 데이터와 약물 신청 데이터를 완전히 통합하여 약물 임상 실험 데이터 소스를 형성하여 약물 임상 실험 데이터 생성을 지원하는 것입니다. 이러한 샘플 데이터는 매우 클 수 있습니다. 이 데이터를 사용하여 "가상" 샘플을 필터링하고 분석하는 방법을 보여 드리겠습니다.

3.3 약물 임상 시험의 샘플 설계

약물 연구의 필요에 따라, 약물 임상 시험 샘플의 설계는 단일요소 단일수준 설계, 단일요소 2 수준 설계, 단일요소 다수준 설계, 페어링 설계, 구단 설계, 반복 측정 설계 등 다양하다. 다음은 2 요소 블록 설계를 예로 들어 샘플 필터링을 소개합니다. 이 예는 단지 방법을 시연하기 위해서일 뿐, 엄격한 의학 전공의 의의는 고려하지 않는다.

본 연구의 질병은 동맥죽 경화성 심장병이며, 치료 요인은 약물 응용이다. * * * 베타락, 노화영, 질산이산리에스테르라는 세 가지 약이 있습니다. 블록 그룹의 요인은 나이이며 세 연령대로 나뉜다. 관찰 지표는 혈나트륨이다. 우리의 과학 연구 설계는' 3 요소 4 원칙' 을 바탕으로 데이터를 선별한 것이다. 이른바' 3 요소' 란 인파, 가공 요소, 관찰 대상을 연구하는 것이다. 4 대 원칙이란 무작위성 원칙, 비교성 원칙, 반복성 원칙, 균형성 원칙을 말한다. 아래 그림 1 에 표시된 입력 조건에 따라 데이터 세트를 필터링한 다음 통계 분석 도구를 사용하여 통계 분석을 수행할 수 있습니다.

3.4 약물 임상 데이터 마이닝

데이터 마이닝 기술의 응용은 약물 임상 데이터의 활용도를 높일 뿐만 아니라 약물 임상 응용에서 새로운 긍정적인 효과를 탐구하고 발견할 수 있다. 다양한 데이터 마이닝 방법을 사용하여 임상 실험 데이터와 환자 전자 데이터를 분석하면 더 많은 약물 적응증을 확인하고 알 수 없는 부작용을 발견할 수 있다. 임상 실험 데이터와 환자 기록을 발굴하고 분석한 후, 약물은 다른 적응증에 대해 재배치되거나 보급될 수 있다. 약물 실험 데이터를 발굴함으로써 예상치 못한 결과를 발견할 수 있어 데이터의 응용 효율을 크게 높일 수 있다.

예를 들어, 우리는 데이터 마이닝 방법을 사용하여 약물이 실험실 지표에 미치는 영향을 깊이 연구합니다. 임상 응용에서 약물의 긍정적이고 부정적인 효과를 탐구하고 발견하는 것은 환자가 약을 복용하기 전후의 여러 가지 의학적 특징과 생리 지표를 관찰함으로써 할 수 있으며, 보다 객관적인 실험실 지표를 관찰하는 것은 많은 약물 연구에 필요한 설계 중 하나이다. 다음은 베타락의 관심병 치료에 대한 응용연구입니다. 우리는 데이터 마이닝의 관련 기술을 적용하여 베타락혈약 농도의 변화가 환자의 각 실험실 지표에 미치는 영향을 분석했다. 아래 그림 2 에 나와 있는 바와 같이 일부 실험실 지표의 영향 결과가 나와 있다.

위의 결과는 임상 의료진 및 약물 연구원과 논의해야 한다. 각종 인적 요인과 상업 시스템의 객관적 요인을 배제한 후, 우리는 이전에 알려지지 않았던 배타락이 환자의 생리지표에 미치는 영향, 어떤 것은 의학적으로 긍정적인 영향일 수도 있고, 어떤 것은 의학적으로 부정적인 영향일 수도 있다는 것을 발견할 수 있다.

3.5 통계 분석 설계

가상 약물 임상 실험 분석 시스템의 통계 분석 모듈에는 T 검사, 분산 분석, 관련 분석, 회귀 분석, 비패라메트릭 검사 등 약물 개발에 일반적으로 사용되는 통계 분석 방법이 포함되어 있습니다. 디자인 사상은 통계적 사고에 기초한다. 먼저 데이터를 검증하고 검증 결과에 따라 통계 분석 방법을 선택합니다. 반복적인 측량 설계를 예로 들어 설명하겠습니다.

본 연구에서 진행된 질병은 동맥죽 경화성 심장병으로, 치료 요인이 배타락의 약이며, 관찰 지표는 우리가 데이터 발굴에서 발견한 영향력 있는 혈칼륨 지표이다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 건강명언) 3.3 에 제공된 모듈을 사용하여 필터링된 샘플을 추출하고 분석하거나 이 모듈에서 필요한 데이터를 직접 선택하여 분석할 수 있습니다. 반복 측정 분석에는 두 가지 방법이 있습니다. 하나는 호틀린 T2 검사이고 다른 하나는 분산 분석입니다. 이 시스템은이 두 가지 통계 테스트 방법을 제공합니다.

다음 그림 3 은 몇 가지 샘플 데이터를 보여줍니다.

여기서는 아래 그림 4 와 같이 분산 분석 방법의 출력만 관찰합니다.

그림에서 볼 수 있듯이 P 의 값에 따르면 치료인자' 베타락크' 는 혈칼륨에 영향을 주고, 측정시간은 혈칼륨에 영향을 주며, 치료인자와 측정시간은 상호 작용한다. 따라서 데이터 마이닝 애플리케이션을 통해 얻은 결과가 검증되었습니다.

한의학 연구 개발에 데이터 마이닝 적용

앞서 살펴본 바와 같이, 서양 의학의 연구와 응용을 예로 들어 데이터 마이닝이 특징인 가상 의학 연구 방법을 설명하고자 합니다. 사실, 데이터 마이닝과 가상 약물 연구도 한의학 연구에 적합하다. 한의학 자체가 의학이기 때문이다. 수천 년간의 지속적인 탐구, 축적, 검증을 거쳐 방대한 지식체계와 완전한 이론체계를 갖추고 있지만, 우리는 여전히 현대지식을 적용하여 끊임없이 이해하고 발굴하고 보완하고 응용해야 현대과학과 더 잘 결합할 수 있다. 데이터 마이닝은 한의학의 신비를 탐구하고 해석하는 강력한 도구이다!

국내 많은 기관들도 지방성의 한의학 데이터 발굴 시도를 진행했다. 이제 한의학 연구에서 이러한 데이터 마이닝의 시도를 요약하면 다음과 같습니다. 1, 한약 처방의 텍스트 데이터 마이닝; 2.' 유효성분' 발굴-'약리학' 에서 중요한 역할을 하는 단체 또는 화학성분 3. 데이터 마이닝과 한약 처방의 호환성 법칙 연구: 4. 처방전 호환성의 물질적 기반과 효능 사이의 관계에 대한 데이터 마이닝 (예: 증상 및 증상) 5. 방제의 배합량과 방제의 효용 수준 사이의 관계 (양효관계와 모델) 를 발굴하다. 한약의 약성 이론과 한약의 활성 성분 사이의 관계를 탐구한다. 처방전에서 약물 사이의 상관 관계를 파헤 치십시오. 8. 유사한 질병의 함축적 유사성을 발굴한다. 9. 동병의 다른 쪽과의 유사점과 차이점을 발굴하고 연구하다. 10. 데이터 마이닝은 부정확한 질병의 분류 및 연구에 사용됩니다.