[
Tugas Kuliah ] Konsep Teknologi Informasi | Artikel Aplikasi BIG Data
Tugas
TI POLITALA Konsep Teknologi Informasi 1A
Nama
: Vify Alaisia Melyani
Kelas
: 1A Teknik
Informatika
NIM
: 1801301110
Matkul
: Konsep Teknologi Informasi
Semester
: Semester 1
BIG DATA
A. Pengertian Big Data
Big
Data adalah istilah umum untuk segala kumpulan himpunan data dalam jumlah
yang sangat besar dan kompleks sehingga menjadikannya sulit untuk ditangani
atau di proses jika hanya menggunakan manajemen basis data biasa atau aplikasi
pemroses data tradisional.
Big
Data menjamin pemrosesan solusi data dengan varian baru maupun yang sudah ada
untuk memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran
dan kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan
dengan tujuan bisnis.
Hal
terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data melainkan
maanfaat yang dapat disadari oleh perusahaan dengan menggunakan Big Data
Analytics Termilogi Big Data diyakini berasal datri perusahaan pencariaan web
yang mengolah data dengan gregasi yang terdistribusi sangat besar dan tidak
terstruktur.
Artikel
ini akan mengupas beberapa contoh penerapan teknologi Big Data dalam bidang
kesehatan.
1.
Teknologi Hadoop untuk Pemantauan
Kondisi Vital Pasien
Beberapa
rumah sakit di seluruh dunia telah menggunakan Hadoop untuk membantu stafnya
bekerja secara efisien dengan Big Data. Tanpa Hadoop, sebagian besar sistem
layanan kesehatan hampir tidak mungkin menganalisis data yang tidak
terstruktur.
Children's Healthcare of Atlanta
merawat lebih dari 6.200 anak di unit ICU mereka. Rata-rata durasi tinggal di
ICU Pediatrik bervariasi dari satu bulan sampai satu tahun. Children's
Healthcare of Atlanta menggunakan sensor di samping tempat tidur yang membantu
mereka terus melacak kondisi vital pasien seperti tekanan darah, detak jantung
dan pernafasan. Sensor ini menghasilkan data yang sangat besar, dan sistem yang
lama tidak mampu untuk menyimpan data tersebut lebih dari 3 hari karena
terkendala biaya storage. Padahal rumah sakit ini perlu menyimpan tanda-tanda
vital tersebut untuk dianalisa. Jika ada perubahan pola, maka perlu ada alert
untuk tim dokter dan asisten lain.
Sistem tersebut berhasil
diimplementasikan dengan menggunakan komponen ekosistem Hadoop : Hive, Flume, Sqoop,
Spark, dan Impala. Setelah keberhasilan project tersebut, project berbasis Hadoop
selanjutnya yang mereka lakukan adalah riset mengenai asma dengan menggunakan
data kualitas udara selama 20 tahun dari EPA (Environment Protection Agency).
Tujuannya: mengurangi kunjungan IGD dan rawat inap untuk kejadian terkait asma
pada anak-anak.
2. Valence health : peningkatan
kualitas
layanan dan reimbursements
Valence health menggunakan Hadoop untuk membangun data lake
yang merupakan penyimpanan utama data perusahaan. Valence memproses 3000
inbound data feed dengan 45 jenis data setiap harinya. Data kritikal ini
meliputi hasil tes lab, data rekam medis, resep dokter, imunisasi, obat, klaim
dan pembayaran, serta klaim dari dokter dan rumah sakit, yang digunakan untuk
menginformasikan keputusan dalam peningkatan baik itu pendapatan ataupun
reimbursement. Pertumbuhan jumlah klien yang pesat dan peningkatan volume data
terkait semakin membebani infrastruktur yang ada.
Sebelum menggunakan big data, mereka
membutuhkan waktu hingga 22 jam untuk memproses 20 juta records data hasil
laboratorium. Penggunaan big data memangkas waktu siklus dari 22 jam menjadi 20
menit, dengan menggunakan hardware yang jauh lebih sedikit. Valence Health juga
mampu menangani permintaan pelanggan yang sebelumnya sulit untuk diselesaikan.
Misalnya jika seorang klien menelpon dan mengatakan bahwa ia telah mengirimkan
file yang salah 3 bulan yang lalu, dan perlu untuk menghapus data tersebut.
Sebelumnya dengan solusi database tradisional, mereka memerlukan 3 sampai 4
minggu. Dengan memanfaatkan MapR snapshot yang menyediakan point-in-time
recovery, Valence dapat melakukan roll-back dan menghapus file tersebut dalam
hitungan menit.
3. Hadoop
dalam Pengobatan Kanker
dan Genomics
Salah satu alasan terbesar mengapa
kanker belum dapat dibasmi sampai sekarang adalah karena kanker bermutasi dalam
pola yang berbeda dan bereaksi dengan cara yang berbeda berdasarkan susunan
genetik seseorang. Oleh karena itu, para peneliti di bidang onkologi menyatakan
bahwa untuk menyembuhkan kanker, pasien perlu diberi perawatan yang disesuaikan
dengan jenis kanker berdasarkan genetika masing-masing pasien.
Ada sekitar 3 miliar pasangan
nukleotida yang membentuk DNA manusia, dan diperlukan sejumlah besar data untuk
diorganisir secara efektif jika kita ingin melakukan analisis. Teknologi big
data, khususnya Hadoop dan ekosistemnya memberikan dukungan yang besar untuk
paralelisasi dan proses pemetaan DNA.
David Cameron, Perdana Menteri
Inggris telah mengumumkan dana pemerintah sebesar £ 300 juta pada bulan
Agustus, 2014 untuk proyek 4 tahun dengan target memetakan 100.000 genom
manusia pada akhir tahun 2017 bekerja sama dengan perusahaan Bioteknologi
Amerika Illumina dan Genomics Inggris. Tujuan utama dari proyek ini adalah
memanfaatkan big data dalam dunia kesehatan untuk mengembangkan personalized
medicine bagi pasien kanker.
Arizona State University mengadakan sebuah proyek penelitian
yang meneliti jutaan titik di DNA manusia untuk menemukan variasi penyebab
kanker sedang berlangsung. Proyek ini merupakan bagian dari Complex Adaptive
Systems Initiative (CASI), yang mendorong penggunaan teknologi untuk
menciptakan solusi bagi permasalahan dunia yang kompleks. Dengan menggunakan Apache Hadoop, tim peneliti universitas
dapat memeriksa variasi dalam jutaan lokasi DNA untuk mengidentifikasi
mekanisme kanker dan bagaimana jaringan berbagai gen mendorong kecenderungan
dan efek kanker pada individu. "Proyek kami memfasilitasi penggunaan data
genomik berskala besar, sebuah tantangan bagi semua institusi penelitian yang
menangani pecision medicine," kata Jay Etchings, direktur komputasi riset
ASU. Ekosistem Hadoop dan struktur data lake terkait menghindarkan setiap
peneliti dan pengguna klinis untuk mengelola sendiri jejak data genomik yang
besar dan kompleks.
4. UnitedHealthcare:
Fraud, Waste, and Abuse
Saat ini setidaknya 10% dari
pembayaran asuransi Kesehatan terkait dengan klaim palsu. Di seluruh dunia
kasus ini diperkirakan mencapai nilai miliaran dolar. Klaim palsu bukanlah
masalah baru, namun kompleksitas kecurangan asuransi tampaknya meningkat secara
eksponensial sehingga menyulitkan perusahaan asuransi kesehatan untuk
menghadapinya.
UnitedHealthCare adalah sebuah
perusahaan asuransi yang memberikan manfaat dan layanan kesehatan kepada hampir
51 juta orang. Perusahaan ini menjalin kerja sama dengan lebih dari 850.000
orang tenaga kesehatan dan sekitar 6.100 rumah sakit di seluruh negeri. Payment
Integrity group/divisi integritas pembayaran mereka memiliki tugas untuk
memastikan bahwa klaim dibayar dengan benar dan tepat waktu. Sebelumnya
pendekatan mereka untuk mengelola lebih dari satu juta klaim per hari (sekitar
10 TB data tiap harinya) bersifat ad hoc, sangat terikat oleh aturan, serta
terhambat oleh data yang terpisah-pisah. Solusi yang diambil oleh
UnitedHealthCare adalah pendekatan dual mode, yang berfokus pada alokasi
tabungan sekaligus menerapkan inovasi untuk terus memanfaatkan teknologi
terbaru.
Dalam hal pengelolaan tabungan,
divisi tersebut membuat “pabrik” analisis prediktif di mana mereka
mengidentifikasi klaim yang tidak akurat secara sistematis dan tepat. Saat ini Hadoop
merupakan data framework berplatform tunggal yang dilengkapi dengan tools untuk
menganalisa informasi dari klaim, resep, plan peserta, penyedia layanan
kesehatan yang dikontrak, dan hasil review klaim terkait. Mereka
mengintegrasikan semua data dari beberapa silo di seluruh bisnis, termasuk
lebih dari 36 aset data. Saat ini mereka memiliki banyak model prediktif (PCR,
True Fraud, Ayasdi, dll.) yang menyediakan peringkat provider yang berpotensi
melakukan kecurangan, sehingga mereka dapat mengambil tindakan yang lebih
terarah dan sistematis.
5. Liaison
Technologies: Streaming System
of Record for Healthcare
Liaison Technologies menyediakan
solusi berbasis cloud untuk membantu organisasi dalam mengintegrasikan,
mengelola, dan mengamankan data di seluruh perusahaan. Salah satu solusi
vertikal yang mereka berikan adalah untuk industri kesehatan dan life science,
yang harus menjawab dua tantangan : memenuhi persyaratan HIPAA dan mengatasi
pertumbuhan format dan representasi data.
Dengan MapR Stream, permasalahan
data lineage dapat terpecahkan karena stream menjadi sebuah SOR (System of
Record) dengan berfungsi sebagai log yang infinite dan immutable dari setiap
perubahan data. Tantangan kedua, yaitu format dan representasi data, bisa
digambarkan dengan contoh berikut: rekam medis pasien dapat dilihat dengan
beberapa cara yang berbeda (dokumen, grafik, atau pencarian) oleh pengguna yang
berbeda, seperti perusahaan farmasi, rumah sakit, klinik, atau dokter.
Dengan melakukan streaming terhadap
perubahan data secara real-time ke basis data, grafik, dan basis data MapR-DB, HBase,
MapR-DB JSON, pengguna akan selalu mendapatkan data paling mutakhir dalam
format yang paling sesuai.