muh.haerudin: 06/21/10

DISTRIBUTED DATABASE

TUGAS MANDIRI

KODE MATAKULIAH : SI 138 F

NAMA MATAKULIAH/SKS : SISTEM BASIS DATA / 3 SKS

NIM : 0822461693

NAMA : MUH. HAERUDIN

DOSEN PENGAJAR : HENDRI , M. Kom.

DISTRIBUTED DATABASE

Abstaksi

Secara teori Database adalah suatu sistem yang memproses input berupa data menjadi output yaitu informasi yang diinginkan. Untuk memperoleh Database yang handal perlu diperhatikan hal-hal seperti keamanan data, kualitas data, kemudahan akses, kemudahan pengolahan data, dan kemungkinan untuk pengembangan Database tersebut. Pada DataBase Manajemen System (DBMS) yang tersentralisasi kegagalan pada suatu site akan mematikan seluruh operasional DBMS. Namun pada Distributed DataBase Manajemen System (DDBMS) kegagalan pada salah satu site, atau kegagalan pada hubungan komunikasi dapat membuat beberapa site tidak dapat di akses, tetapi tidak membuat operasional DBMS tidak dapat dijalankan. Dan juga jika terjadi kegagalan dalam pengaksesan data pada suatu site di karenakan jaringan komunikasi terputus maka site yang ingin mengakses data tersebut dapat mengakses pada site yang tidak mengalami kerusakan.

I.PENDAHULUAN

I.1 Latar Belakang

Seiring dengan perkembangan teknologi informasi, dalam hal ini adalah teknologi database dan jaringan komputer, membuat suatu organisasi semakin mudah untuk lebih meningkatkan produktifitas kerjanya. Khususnya bagi organisasi yang mempunyai cabang-cabang yang tersebar di beberapa di tempat, kendala jarak dan waktu bisa teratasi. pengembangan sistem basis data adalah suatu keinginan untuk menyatukan data operasional dari suatu organisasi dan pengaksesan data yang terkontrol. Integrasi data dan kontrol data telah diimplementasikan pada bentuk data tersentralisasi,

Akan tetapi sistem database tersentralisasi mempunyai beberapa kelemahan, seperti putusnya koneksi antara komputer cabang (client database) dengan server database utama, akibat putusnya koneksi jaringan komputer. Atau ketika server database sedang down, masalah yang akan timbul adalah ketidaktersediaan data untuk beberapa waktu. Desain sistem database tersentralisasi juga mempunyai kelemahan lain seperti proses query dari semua client yang dibebankan pada satu server. Hal ini akan mengakibatkan menurunnya performansi dari server database untuk melayani proses transaksi data.

Adanya perkembangan pada jaringan komputer menghasilkan suatu bentuk desentralsasi .Pendekatan desentralisasi ini merupakan gambaran dari suatu organisasi yang memiliki banyak cabang organisasi, dimana terbagi – bagi menjadi beberapa divisi, departemen, proyek dan masih banyak lagi, dan dalam bentuk infrastruktur dan akan terbagi – bagi kembali menjadi beberapa kantor cabang, pabrik-pabrik dimana setiap unit tersebut mengoperasionalkan datanya secara sendiri – sendiri. Data yang digunakan secara bersama- sama dan efisiensi dalam pengaksesan data harus diiringi dengan perkembangan dari sistem basis data terdistribusi, yang merupakan refleksi dari struktur organisasi, sehingga data dapat diakses dimana saja dan melakukan penyimpanan data di lokasi yang memang data tersebut sering digunakan.

Salah satu solusi untuk mengatasi masalah-masalah tersebut adalah dengan mengimplementasikan desain sistem database terdistribusi. Sistem ini mendistribusikan keseluruhan atau sebagian data ke beberapa server database. Distribusi DBMS harus dapat mengatasi sekumpulan permasalahan informasi (islands of information ) itu. Dan DDBMS merupakan jawaban dari masalah geografi, masalah arsitektur komputer , masalah protokol komunikasi dan lain- lainnya. Sehingga sistem ini juga memungkinkan banyak pengguna sistem database yang tersebar di beberapa tempat yang terpisah, dapat melakukan akses dan pengolahan data tanpa harus tergantung pada koneksi ke satu server database utama.

II. PEMBAHASAN

II.1 Database Terdistribusi

Database terdistribusi adalah sebuah database yang diatur oleh sebuah Database Management System (DBMS) yang tersimpan secara fisik pada beberapa komputer yang terdapat pada beberapa lokasi dengan terkoneksi pada sebuah jaringan [3]. jaringan tersebut harus bisa menyediakan akses bagi user untuk melakukan sharing data. Terdapat dua macam sifat dari database terdistribusi yaitu Heterogenous dan Homogenous. Homogenous artinya suatu database terdistribusi dimana data di distribusikan pada beberapa komputer dengan menggunakan DBMS(database management system) yang sama. DBMS digunakan pada database terdistribusi untuk melakukan koordinasi data pada beberapa node. Sedangkan Heterogenous adalah kebalikan dari Homogenous dimana data di sebarkan dengan menggunakan DBMS yang berbeda.

Basis data terdistribusi (distributed database) adalah suatu basis data yang berada di bawah kendali sistem manajemen basis data (DBMS) terpusat dengan peranti penyimpanan (storage devices) yang terpisah-pisah satu dari yang lainnya. Tempat penyimpanan ini dapat berada di satu lokasi yang secara fisik berdekatan (misal: dalam satu bangunan) atau terpisah oleh jarak yang jauh dan terhubung melalui jaringan internet. Penggunaan basis data terdistribusi dapat dilakukan di server internet, intranet atau ekstranet kantor, atau di jaringan perusahaan.

Untuk menjaga agar basis data yang terdistribusi tetap up-to-date, ada dua proses untuk menjaganya, yakni replikasi dan duplikasi. Dalam replikasi, digunakan suatu perangkat lunak untuk mencari — atau lebih tepatnya melacak — perubahan yang terjadi di satu basis data. Setelah perubahan dalam satu basis data teridentifikasi dan diketahui, baru kemudian dilakukan perubahan agar semua basis data sama satu dengan yang lainnya. Proses replikasi memakan waktu yang lama dan membebani komputer karena kompleksitas prosesnya. Sementara itu, proses duplikasi tidak sama dan tidak sekompleks replikasi. Dalam proses ini, satu basis data dijadikan master, kemudian diperbanyak menjadi sejumlah duplikat. Selama proses duplikasi berlangsung, perubahan hanya boleh dilakukan pada basis data master agar data lokal tidak tertimpa.

II.2 Karakteristik database terdistribusi yaitu :

1. Kumpulan data yang digunakan bersama secara logic tersebar pada sejumlah computer yang berbeda

2. Komputer yang dihubungkan menggunakan jaringan komunikasi.

3. Data pada masing-masing situs dapat menangani aplikasi-aplikasi local secara otonom.

4. Data pada masing situs di bawah kendali satu DBMS.

5. Masing-masing DBMS berpartisipasi dalam sedikitnya satu aplikasi global.

II.3 Bentuk-bentuk Topologi Distribusi Data :

Fully Connected Network Kalau salah satu node rusak, yang lainnya masih dapat berjalan (biaya mahal), kontrol manajemen tidak terjamin.
Partialy Connected Network Reliability rendah, biaya dapat ditekan Kontrol manajemen tidak terjamin.
Tree Structured Network Bersifat sentral, control manajemen lebih terjamin Kalau node pusat rusak, semua akan rusak. (setiap proses dimulai dari bawah).
Ring Network Rusak satu, yang lain masih berjalan Kontrol manajemen kurang terjamin karena bersifat dsesentralisasi.
Star Network Rusak satu, yang lain masih berjalan Kontrol manajemen kurang terjamin karena bersifat dsesentralisasi.

II.4 Keuntungan Distribusi Database

Pengawasan distribusi dan pengambilan data Jika beberpa site yang berbeda dihubungkan, seorang pemakai yang berada pada satu site dapat mengakses data pada site lain. Contoh : sistem distribusi pada sebuah bank memungkinkan seorang pemakai pada salah satu cabang dapat mengakses data cabang lain.
Reliability dan availability Sistem distribusi dapat terus menerus berfungsi dalam menghadapi kegagalan dari site sendiri atau mata rantai komunikasi antar site.
Kecepatan pemrosesan query Contoh : jika site-site gagal dalam sebuah sistem terdistribusi, site lainnya dapat melanjutkan operasi jika data telah direplikasi pada beberapa site.
Otonomi lokal Pendistribusian sistem mengijinkan sekelompok individu dalam sebuah perusahaan untuk melatih pengawasan lokal melalui data mereka sendiri. Dengan kemampuan ini dapat mengurangi ketergantungan pada pusat pemrosesan.
Efisiensi dan fleksibel Data dalam sistem distribusi dapat disimpan dekat dengan titik diman data tersebut dipergunakan. Data dapat secara dinamik bergerak atau disain, atau salinannya dapat dihapus.

II.5 Kekurangan Distribusi Database

Harga software mahal Hal ini disebabkan sangat sulit untuk membuat sistem database distribusi.
Kompleksitas Site-site beroperasi secara paralel sehingga lebih sulit untuk menjamin kebenaran dan algoritma. Adanya kesalahan mungkin tak dapat diketahui.
Biaya pemrosesan tinggi Perubahan pesan dan penambahan perhitungan dibutuhkan untuk mencapai koordinasi antar site.
Sulit menjaga keutuhan data Banyaknya pengaksesan data membuat kurangnya sekuritas terhadap data yang telah terdistribusi.
Kurangnya standar Tidak ada tool atau metodologi untuk membantu user mengubah database terpusat ke database terdistribusi.
Kurang pengalaman Sistem DB terdistribusi bertujuan umum (generalpurpose) tidak sering digunakan. Yang digunakan adalah sistem prototype yang dibuat untuk satu aplikasi (misal : reservasi pesawat)
Perancangan basis data lebih kompleks Sebelumnya menjadi keuntungan. Tetapi karena distribusi menyebabkan masalah sinkronisasi dan koordinasi, kontrol terdistribusi menjadi kerugian atau kekurangan di masalah ini.

II.6 Permasalahan

Distributed database memang memiliki banyak keunggulan terlebih untuk struktur organisasi saat ini. Namun diantara keunggulan itu, distributed database juga memungkinkan suatu sistem menjadi lebih kompleks, karena banyaknya database yang tersebar dan jumlah data yang banyak dan terus meningkat didalam suatu organisasi maupun perusahaan. Jika suatu database memiliki sejumlah data yang tersimpan dengan banyak query dan tabel, suatu permintaan mengakibatkan proses pencarian data atau source data menjadi lambat Selain itu banyaknya user yang dapat mengakses suatu tampilan web atau web display suatu sistem informasi juga menjadi lambat. Berikut ini disampaikan tampilan sumber data konvensional yang memiliki query bertingkat:

Gambar . Source Data Konvensional

Dari gambar diatas, kita bisa lihat bahwa untuk menghasilkan suatu tampilan pada web display, pada source data konvensional perlu dilakukan query bertingkat. Source data dilakukan mulai dari table yang satu kemudian tabel yang lain lalu ke query yang satu ke query yang lain. Bayangkan jika ada ratusan atau ribuan tabel dan query didalam suatu database, kemudian database itu terdistribusi sehingga terjadi hubungan antara database yang satu dengan yang lain. Berapa lama waktu yang dibutuhkan hanya untuk memberikan satu tampilan web?

Dari penjelasan di atas, dapat dirumuskan beberapa permasalahan yaitu sebagai berikut :
1. Apakah proses view karena query bertingkat sudah ada penelitiannya?
2. Berapa dampak dari lambatnya sebuah proses akibat query bertingkat?
3. Metode apa untuk mempercepat proses display pada suatu sistem database terdistribusi?
4. Apa kelemahan dan kelebihannya dengan metode baru yang diusulkan ini?

II.7 Literature review

Banyak penelitian yang sebelumnya dilakukan mengenai distributed database. Dalam upaya pengembangan distributed database ini perlu dilakukan studi pustaka sebagai salah satu dari penerapan metode penelitian yang akan dilakukan. Diantaranya adalah mengidentifikasikan kesenjangan (identify gaps), menghindari pembuatan ulang (reinventing the wheel), mengidentifikasikan metode yang pernah dilakukan, meneruskan penelitian sebelumnya, serta mengetahui orang lain yang spesialisasi dan area penelitiannya sama dibidang ini. Beberapa Literature review tersebut adalah sebagai berikut :

Penelitian ini dilakukan oleh Jun Lin Lin dan Margaret H. Dunham dari Southerm Methodist University dan Mario A. Nascimento berjudul “ A Survey of Distributed Database Checkpointing”. Penelitian ini membahas mengenai checkpointing pada database terdistribusi dan pendekatan-pendekatan yang digunakan. Penelitian ini bermula dari adanya banyak survey yang dilakukan berkenaan dengan proses recovery database, dan banyak teknik yang diusulkan untuk mengatasinya. Dengan distributed database checkpointing, dapat mengurangi waktu proses recovery suatu kegagalan didalam database terdistribusi. Checkpointing dapat digambarkan sebagai suatu aktivitas menulis informasi ke penyimpanan yang stabil selama operasi normal dalam rangka mengurangi jumlah pekerjaan pada saat restart. Penelitian ini membantah bahwa sedikit batasan dan sedikit sumber daya menjadi masalah dalam pendekatan database terdistribusi, serta Membantah bahwa checkpointing hanya dapat digunakan untuk sistem distribusi banyak multidatabase. Meskipun penelitian ini telah banyak dilakukan namun cukup rumit dalam implementasinya. Dengan penelitian ini kita dapat mengembangkan database terdistribusi dengan checkpointing untuk mempercepat proses recovery database.
Penelitian ini dilakukan oleh David J. DeWitt dari Universitas Wisconsin dan Jim Gray tahun 1992 berjudul “Parallel Database Systems:The Future of High Performance Database Processing”. Penelitian ini dilakukan dengan Konsep database terdistribusi yang merupakan database yang disimpan pada beberapa komputer yang terdistribusi satu sama lain. Pada penelitian ini, dijelaskan Sistem database paralel mulai menggantikan Mainframe komputer besar untuk pengolahan data dan transaksi tugas. Paralel database komputer memiliki arsitektur yang berkembang dari penggunaan perangkat lunak yang eksotik untuk perangkat keras yang paralel. Seperti kebanyakan aplikasi, user menginginkan hardware sistem database yang murah, cepat. Ini menyangkut tentang prosesor, memori dan disk. Akibatnya, konsep hardware database yang eksotis tidak sesuai untuk teknologi saat ini. Di lain sisi, ketersediaan microprocessors cepat, murah dan kecil menjadi paket standar murah tapi cepat sehingga menjadi platform yang ideal untuk sistem database paralel. Stonebraker mengusulkan rancangan sederhana untuk spektrum disain yaitu shared memory, shared disk dan shared nothing. Dan bahasa yang digunakan dalam database adalah SQL sesuai dengan standar ANSI dan ISO. Dengan penelitian ini, kita dapat mengembangkan sistem database agar dapat digunakan diberbagai ruang lingkup.
Penelitian ini dilakukan oleh Carolyn Mitchell dari Norfolk State University berjudul “Components of a Distributed Database” tahun 2004. Penelitian ini membahas tentang komponen-komponen didalam database. Salah satu komponen utama dalam DDBMS adalah Database Manager. "Sebuah Database Manager adalah perangkat lunak yang bertanggung jawab untuk memproses segmen data yang didistribusikan. Komponen utama lainnya adalah Query User Interface, yang merupakan sebuah program klien yang bertindak sebagai sebuah antarmuka untuk Transaksi Manager yang terdistribusi.." Sebuah Transaksi Manager terdistribusi adalah program yang menterjemahkan permintaan dari pengguna dan mengkonversi mereka ke query database manager, yang biasanya didistribusikan. Sebuah sistem database yang terdistribusi terbuat dari kedua manajer yaitu Database Manager dan Transaksi Manager Terdistribusi.
Penelitian yang dilakukan oleh Hamidah Ibrahim, “Deriving Global Integritas Dan Local Rules For Distributed Database. Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Putra Malaysia, 43400 UPM Serdang. Ibrahim mengatakan bahwa tujuan terpenting didalam database sistem adalah menjamin konsistensi data, yang berarti bahwa data yang terdapat dalam database harus baik dan akurat.Didalam pelaksanaan untuk menjaga konsistensi perubahan data sangat sulit, khususnya untuk didistribusikan dalam database. Dalam tulisan ini, menjelaskan sebuah algoritma penegakan aturan berdasarkan mekanisme untuk didistribusikan database yang bertujuan meminimalisir jumlah data yang harus ditransfer atau diakses diseluruh jaringan yang menjaga konsistensi dari database di satu situs, yaitu di situs mana pembaruan perlu dilakukan. Teknik ini disebut sebagai tes integritas generasi, yang berasal dari local dan global integritas, dan aturan yang telah efektif dapat mengurangi biaya kendala dalam memeriksa suatu data yang telah didistribusikan dalam lingkungan. Didalam penelitian ini upaya telah berhasil didalam menghasilkan sebuah sistem sentralistik yang besar tingkat kehandalan dan kesegarannya sehubungan dengan integritas data.
Penelitian yang dilakukan oleh Steven P. Coy. “Security Implication of the Choice of Distributed Database Management System Model: Relational Vs Object Oriented. University of Maryland bahwa keamanan data harus dibenahi ketika mengembangkan database dan diantaranya memilih antara relational dan object oriented model. Banyak faktor yang harus dipertimbangkan, terutama dari segi efektifitas dan efisiensi, juga apakah sekuritas dan integritas ini memakan sumber daya yang terlalu besar tidak semata mata fitur keamanan. Disimpulkan bahwa kedua pilihan ini akan mempengaruhi kekuatan dan kelemahan dari database tersebut. Untuk centralized database kedua model ini bisa dikatakan sama baiknya. Namun untuk distributed database, relational model unggul dibidan sekuritas. Ini lebih banyak disebabkan bahwa object oriented model database masih kurang maturitasnya. Tetap saja didalam lingkungan heterogenous, proses integritasnya masih menimbulkan masalah. OODBMS tetap saja masih perlu perkembangan teknologi lebih lanjut, namun di lingkungan homogenous, OODBMS dapat menjadi pilihan yang baik.
Penelitian yang dilakukan oleh Stephane Gançarski, Claudia León, Hubert Naacke, Marta Rukoz and Pablo Santini yang berjudul “Integrity Constraint Checking in Distributed Nested Transactions over a Database Cluster” adalah sebuah solusi untuk memeriksa integritas dan kendala global dalam berhubungan multi database sistem. Penelitian ini juga menyajikan hasil eksperimental yang diperoleh atas solusi PC cluster dengan Oracle9i DBMS. Tujuan adalah melakukan eksperimentasi untuk mengukur waktu yang dihabiskan dalam memeriksa kendala global dalam sistem yang terdistribusi. Alhasil menunjukkan bahwa overhead berkurang hingga 50% dibandingkan dengan pemeriksaan integritas yang terpusat. Studi menunjukkan bahwa sistem berkemungkinan besar melanggar referential integritas dan global conjunctive constraints. Namun dengan cara distributed nested transactions, dengan adanya eksekusi dan parallelism, integritas dapat lebih terjamin.
Penelitian ini dilakukan oleh Allison L. Powell James C.dkk, Perancis Departemen Ilmu Komputer Universitas Virginia, berjudul berjudul The Impact of Database Selection on Distributed Searching. Penelitian ini menjelaskan bahwa distributed searching terdiri dari 3 bagian yaitu database selection, query processing, dan results merging. Cukup beberapa database yang dijadikan database seleksi (tidak semuanya) dan performa akan meningkat cukup signifikan. Bila seleksi database dilakukan dengan baik, pencarian secara distributed akan berkinerja lebih baik dibandingkan pencarian secara sentralisasi. Pencarian database juga ditambahkan proses seleksi dan ranking sehingga secara potensial meningkatkan efektifitas pencarian data.
Penelitian ini dilakukan oleh Yin-Fu Huang dan HER JYH-CHEN (2001) dari Universitas Nasional Sains dan Teknologi Yunlin Taiwan, berjudul Fragment Allocation in Distributed Database Design. Pada penelitian ini menjelaskan mengenai Wild Area Network (WAN), fragmen alokasi adalah isu utama dalam distribusi database desain karena kekhawatiran kinerja keseluruhan didistribusikan pada system database. Disini system yang diusulkan sederhana dan modelnya yang komprehensif mencerminkan aktivitas transaksi yang didistribusikan dalam database. Berdasarkan model dan informasi transaksi, dua bentuk algoritma dikembangkan untuk mendapatkan alokasi yang optimal seperti total biaya komunikasi yang sebisa mungkin diminimalkan. Hasilnya menunjukkan bahwa alokasi fragmentasi ditemukan dengan menggunakan algoritma yang tepat akan menjadi lebih optimal. Beberapa penelitian juga dilakukan untuk memastikan bahwa biaya rumus dapat benar-benar mencerminkan biaya komunikasi didunia nyata.
Penelitian ini dilakukan oleh Nadezhda Filipova dan Filcho Filipov (2008) dari University of Economics. Varna, Bul. Kniaz BorisI berjudul Development of database for distributed information measurement and control system. Penelitian ini menjelaskan mengenai pengembangan database dari pengukuran informasi yang didistribusikan dan sistem kontrol yang menerapkan metode optik untuk plasma spectroscopy fisika dan penelitian atom collisions dan menyediakan akses untuk mendapat informasi dan sumber daya perangkat keras di jaringan Intranet/Internet, berdasarkan database pada sistem manajemen database Oracle9i. Perangkat lunak klien yang diwujudkan adalah dalam Java Language. Perangkat lunak ini dikembangkan dengan menggunakan model arsitektur, yang memisahkan aplikasi data dari komponen grafis presentasi dan masukan pengolahan logika. Berikut grafis presentasi telah dilaksanakan, pengukuran radiasi dari Spectra beam plasma dan benda, perangsangan fungsi non-elastis collisions dari berat partikel dan analisis data yang diperoleh dalam percobaan sebelumnya. Berikut grafis klien yang memiliki fungsi interaksi dengan database browsing informasi tentang percobaan dari jenis tertentu, pencarian data dengan berbagai kriteria, dan memasukkan informasi tentang percobaan sebelumnya.
Penelitian yang dilakukan oleh Lubomir Stanchev dari University of Waterloo tahun 2001 berjudul “Semantic Data Control In Distributed Database Environment”. Penelitian ini menyatakan bahwa ada tiga tujuan utama dalam semantic data control yaitu: view manajemen, data security dan semantic integrity control. Dalam sebuah relasi, fungsi-fungsi ini dapat mencapai keseragaman dengan menegakkan aturan-aturan manipulasi kontrol data. Solusinya adalah dengan sentralisasi ataupun terdistribusi. Dua hal utama yang efisien untuk melakukan kontrol adalah definisi data dan penyimpanan aturan (situs pilihan) dan penegakan desain algoritma yang meminimalkan biaya komunikasi. Masalahnya adalah sulit, karena peningkatan fungsi (dan umum) cenderung meningkatkan komunikasi situs. Solusi untuk semantik data kontrol terdistribusi adalah eksistensi dari sentralisasi solusi. Masalahnya adalah sederhana jika aturan kontrol sepenuhnya direplikasi di semua situs dan sulit jika situs otonomi dipatenkan. Selain itu, khusus optimasi dapat dilakukan untuk meminimalkan biaya kontrol data tetapi dengan tambahan overhead seperti pengelolaan data snapshot. Dengan demikian, spesifikasi kontrol data terdistribusi harus disertakan pada desain database sehingga biaya kontrol update untuk program-program ini juga dipertimbangkan.

Dari sepuluh literature review yang ada, telah banyak penelitian mengenai checkpointing, parallel database system, pembahasan component database system, juga mengenai security. Disamping itu juga ada pembahasan mengenai nested transaction, distributed searching, view management dan juga fragment allocation. Namun dapat disimpulkan pula bahwa belum ada peneliti yang secara khusus membahas atau mengatasi masalah proses view yang lambat akibat query bertingkat.

II.8 Pemecahan Masalah

Untuk mengatasi berbagai masalah diatas, maka diperlukan proses yang cepat dan efisien dalam mengakses seluruh data yang banyak dan tidak teratur di database, terlebih untuk suatu sistem database yang terdistribusi. Saat ini programmer lebih memilih menggunakan Ms Acces dan fungsi query untuk mengerjakan seluruh script perintah. Alhasil proses query besar-besaran terjadi setiap membutuhkan data. Penggunaan SQL server bukanlah hal yang baru dalam hal ini, maka dari itu diusulkan untuk dibentuknya suatu system yang lebih menuju ke proses pada saat loading penyajian data dan memiliki kecepatan yang secara kuadratik lebih cepat dibandingkan dengan cara konvensional. DMQ (Data Mart Query) merupakan metode yang menerapkan analogi ”Waste Space for Speed”. DMQ juga merupakan salah satu metode yang berbentuk terhadap pemisahan antara “Engine” dan “Display”. Dengan kata lain metode DMQ dapat langsung menampilkan source code pada display dan proses query yang dikerjakan pada engine. Secara umum DMQ menghasilkan sebuah display data yang jauh lebih cepat dibandingkan dengan menggunakan metode umum, karena DMQ tidak melakukan proses lagi dalam menampilkan data. Dan akhirnya DMQ merupakan suatu solusi yang dapat membantu kebutuhan user pada proses display data yang sebelumnya sangat lambat dan tidak efesien.

Pada Data Mart Query sumber data berasal dari tabel. Jadi pada proses DMQ ini, mengalokasikan seluruh data yang dipilih ke dalam suatu tabel.Sehingga user tidak perlu memikirkan pembuatan struktur tabel tujuan, yang perlu dipikirkan hanyalah dimana data tersebut berada. DMQ ini digunakan untuk menghindari penggunaan Query majemuk. DMQ akan mengorbankan besarnya kapasitas penyimpanan data (space harddisc) untuk meningkatkan kecepatan (increase speed). DMQ membutuhkan triger update data untuk menghasilkan data yang mutakhir.

Berikut ini adalah gambaran mengenai permintaan data dari user. Dimana seorang user melakukan permintaan akan suatu tampilan, kemudian data query module melakukan pencarian pada db1, db2 sampai dbn. Dengan menggunakan Data mart queries atau DMQ dari data query module langsung menghasilkan query yang diinmginkan dalam bentuk graphical display module yang dapat dilihat oleh user.

Gambar . Data Visualization dengan DMQ

Dengan Data Mart Query (DMQ) proses pencarian data lebih singkat, karena tidak seperti source data konvensional yang harus mencari dari tabel. Data Mart Query (DMQ) bisa memotong waktu proses karena proses pencarian data hanya ke satu tabel yang telah digabungkan.

Gambar . Perbandingan source data konvensional

dan source data dengan Data Mart Query

Jika dibandingkan maka tampilannya akan seperti gambar diatas. Dimana dengan DMQ bisa membuat tampilan web lebih cepat dilakukan karena tidak memerlukan proses pencarian yang rumit. Hal ini juga dapat dibuktikan pada grafik .

Keterangan :
= Tidak menggunakan DMQ
= Menggunakan DMQ

Grafik . Perbandingan Waktu dan Jumlah data

Pada grafik diatas, dapat dilihat bagaimana perbandingan waktu dan jumlah data untuk suatu display web dimana jumlah data untuk masing-masing grafik nilainya sama. Grafik diatas menjelaskan bahwa jika suatu view tidak menggunakan DMQ, maka grafiknya akan naik keatas, atau semakin besar jumlah data maka waktu prosesnya akan semakin lama. Dengan demikian secara eksponensial dapat dinyatakan sebagai berikut:

Y = mX2+ b

Namun sebaliknya jika menggunakan DMQ untuk viewnya maka berapapun jumlah datanya waktu yang dibutuhkan untuk proses viewnya relatif konstan.

Jumlah Data Waktu Waktu(DMQ)
250 12 0.80
500 18 0.86
750 20 0.89
1000 25 0.90
1250 30 0.95
1500 32 0.98
1750 41 1.00
2000 53 1.00
2250 66 0.99
Tabel . Perbandingan waktu proses

muh.haerudin

Senin, 21 Juni 2010

TUGAS SISTEM BASISDATA ( SI 138 F )

DISTRIBUTED DATABASE

TUGAS SISTEM BASISDATA

heru_coboy

Link

Mengenai Saya

Ini looooh......! Klo mao liat jam

My Photo Collection

my music

Arsip Blog

Guest Book

Pengikut

Coba simak video dibawah ini dan pastikan suara atau speaker anda aktif. Dijamin kocak .....