약에있는 큰 자료의 근원

약에있는 큰 자료의 근원

의학에서 빅 데이터의 단순한 정의는 "환자의 건강 관리 및 복지와 관련된 데이터의 총체"입니다 (Raghupathi 2014). 그러나 이러한 유형의 데이터는 정확히 무엇이며 어디에서 왔습니까?

다음은 건강 관리 제공자, 연구원, 지불 자, 정책 입안자 및 업계가 관심을 갖는 커다란 데이터 유형 및 출처에 대한 전반적인 개요입니다.

동일한 데이터가 다양한 출처에서 비롯 될 수 있기 때문에 이러한 범주는 상호 배타적 인 것이 아닙니다.

빅 데이터 애널리틱스의 실용적인 응용 프로그램이 지속적으로 확장 될 것이기 때문에이 목록은 철저하지 않습니다.

임상 정보 시스템

이것들은 건강 관리 제공자가보기에 익숙한 전통적인 임상 자료입니다.

지불 자의 청구 데이터

공공 지불 인 (예 : Medicare)과 개인 지불 인은 수혜자에 대한 청구 데이터의 저장소가 많습니다. 일부 건강 보험 회사는 현재 귀하의 건강 데이터 공유에 대한 인센티브를 제공합니다.

연구 조사

연구 데이터베이스는 연구 참가자, 실험 치료 및 임상 결과에 대한 정보를 포함합니다. 대규모 연구는 일반적으로 제약 회사 또는 정부 기관에서 후원합니다. 개인화 된 약의 응용은 임상 시험 데이터의 패턴에 기초하여 효과적인 치료법으로 개별 환자를 일치시키는 것입니다.

이 접근법은 증거 기반 의학 원리를 적용하는 것 이상으로 이동하여 의료 제공자가 환자가 시범 참가자와 광범위한 특성 (예 : 연령, 성별, 인종, 임상 상태)을 공유하는지 여부를 결정합니다. 빅 데이터 분석을 사용하면 환자 암의 유전 적 특성 (아래 참조)과 같이 훨씬 더 정교한 정보를 기반으로 한 치료법을 선택할 수 있습니다.

임상 의사 결정 지원 시스템 (CDSS)도 빠르게 발전해 왔으며 이제는 인공 지능 (AI)의 중요한 부분을 차지합니다.

그들은 의사의 의사 결정을 돕기 위해 환자 데이터를 사용하며 흔히 EHR과 결합됩니다.

유전 데이터베이스

인간 유전 정보 저장소는 빠른 속도로 계속 축적됩니다. 휴먼 게놈 프로젝트가 2003 년에 완료 되었기 때문에 인간 DNA 시퀀싱 비용은 백만 배 줄어 들었습니다. 하버드 의과 대학 (Harvard Medical School)이 2005 년에 시작한 PGP (Personal Genome Project)는 전 세계의 100,000 명의 자원 봉사자를 대상으로 전체 게놈을 서열화하고 홍보하기 위해 노력하고 있습니다. PGP 자체는 엄청난 양의 데이터와 다양한 데이터로 인해 큰 데이터 프로젝트의 대표적인 예입니다.

개인 게놈에는 약 100 기가 바이트의 데이터가 들어 있습니다. 게놈 시퀀싱 외에도 PGP는 EHR, 조사 및 미생물 프로파일로부터 데이터를 수집하고 있습니다.

많은 회사들이 상업적으로 건강, 개인 특성 및 약리 유전학에 대한 소비자 직접 유전자 시퀀싱 을 제공합니다.

이 개인 정보는 빅 데이터 분석에 종속 될 수 있습니다. 예를 들어, 23andMe는 미국 식품의 약국 (FDA)을 준수하기 위해 2013 년 11 월 22 일부터 신규 고객에게 건강 관련 유전자 보고서를 제공하는 것을 중단했습니다. 그러나 2015 년에 FDA의 승인을 얻어 유전 적 타액 검사의 특정 건강 요소를 다시 제공하기 시작했습니다.

공공 기록

정부는 이민, 혼인, 출생 및 사망과 같은 건강 관련 사건에 대한 상세한 기록을 보관합니다. US Census는 1790 년 이래 10 년마다 방대한 양의 정보를 수집했습니다. Census의 통계 웹 사이트는 2013 년 현재 3700 억 개의 셀을 보유하고 있으며 매년 약 110 억 개가 추가됩니다.

웹 검색

Google 및 기타 웹 검색 제공 업체가 수집 한 웹 검색 정보는 인구의 건강과 관련된 실시간 통찰력을 제공 할 수 있습니다. 그러나 웹 검색 패턴의 큰 데이터 가치는 기존의 건강 데이터 소스와 결합하여 향상 될 수 있습니다.

소셜 미디어

Facebook, Twitter 및 기타 소셜 미디어 플랫폼은 24 시간 내내 다양한 ​​데이터를 생성하여 사용자의 위치, 건강 행태, 감정 및 소셜 상호 작용을 볼 수 있습니다. 공중 보건에 대한 소셜 미디어의 빅 데이터 적용은 디지털 질병 탐지 또는 디지털 역학이라고합니다. 예를 들어, 트위터는 일반 인구 중 인플루엔자 유행을 분석하는 데 사용되었습니다.

펜실베니아 대학에서 시작된 세계 복지 프로젝트는 사람들의 경험과 건강을 더 잘 이해하기 위해 소셜 미디어를 연구하는 또 다른 사례입니다. 이 프로젝트에는 심리학자, 통계 학자 및 컴퓨터 과학자들이 모여 온라인상에서 상호 작용할 때 사용되는 언어를 분석합니다. 예를 들어 Facebook 및 Twitter에 상태 업데이트를 작성할 때 사용합니다. 과학자들은 사용자의 언어가 건강과 행복과 어떻게 관련되어 있는지 관찰하고 있습니다. 자연 언어 처리 및 기계 학습의 발전은 그들의 노력을 돕고 있습니다. 펜실베이니아 대학의 최근 간행물은 소셜 미디어를 분석하여 정신 질환을 예측하는 방법을 살펴 보았습니다. 우울증 및 기타 정신 건강 상태의 증상은 인터넷 사용을 연구함으로써 감지 될 수 있습니다. 과학자들은 미래에 이러한 방법이 위험에 처한 사람들을 더 잘 식별하고 도울 수 있기를 희망합니다.

사물의 인터넷 (IoT)

건강 관련 정보의 대량 수집 또한 모바일 및 가정용 기기 에 저장됩니다.

금융 거래

환자의 신용 카드 거래는 Carolinas HealthCare System이 병원에 재 입원 할 위험이 높은 환자를 확인하기 위해 사용하는 예측 모델에 포함됩니다. 샬럿에 본사를 둔 의료 서비스 제공 업체는 큰 데이터를 사용하여 환자를 질병 및 지리적 위치와 같은 다양한 그룹으로 나눕니다.

윤리적 및 개인 정보 보호에 대한 시사점

헬스 케어에서 데이터를 수집하고 액세스 할 때 중요한 윤리 및 사생활 보호가있을 수 있다는 점을 강조해야합니다. 큰 데이터의 새로운 출처는 개인과 인구의 건강에 어떤 영향을 미치는지에 대한 우리의 이해를 향상시킬 수 있지만, 다른 위험을 신중하게 고려하고 모니터링해야 할 필요가 있습니다. 이전에는 익명으로 간주되었던 데이터를 다시 식별 할 수 있다는 것도 인정되었습니다. 예를 들어 Harvard의 Data Privacy Lab의 Latanya Sweeney 교수는 Personal Genome Project에 참여한 1,130 명의 자원 봉사자를 검토했습니다. 그녀와 그녀의 팀은 그들이 공유 한 정보 (우편 번호, 생년월일, 성별)를 토대로 참가자의 42 퍼센트 를 정확하게 지을 수있었습니다. 이 지식은 잠재적 인 위험에 대한 인식을 높이고 더 나은 데이터 공유 결정을 내릴 수있게 해줍니다.

> 출처 :

> Conway M, O'Connor D. 소셜 미디어, 큰 데이터 및 정신 건강 : 현재의 진보와 윤리적 함의. 심리학에있는 현재 의견 2016 년; 9 : 77-82.

> Fernandes L, O'Connor M, Weaver V. 큰 데이터, 더 큰 성과. 2012 미국 건강 정보 관리 학회지 , 83 (10) : 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. 소셜 미디어에서의 우울증과 정신병 진단 : 통합 검토 . 행동 과학 2017 년에 있는 현재 의견 ; 18 : 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Google 독감의 비유 : 빅 데이터 분석의 함정 . 과학 2014; 343 (6176) : 1203-1205.

> Raghupathi W, Raghupathi V. 의료 분야의 거대한 데이터 분석 : 약속과 가능성. 건강 정보 과학과 시스템 2014; 2 : 3.

> Sweeney L, Abu A, Winn J. 개인 게놈 프로젝트의 참가자 식별 . 하버드 대학교. 데이터 개인 정보 보호 연구소 백서 1021-1. 2013 년 4 월 24 일