Teknik Dasar Scraping Data dari Website Lain


Web Scraping
 merupakan sebuah teknik dalam istilah pemograman yang tugasnya adalah mengambil data-data yang ada pada suatu website dan mengumpulkannya dalam 1 wadah atau dalam 1 berkas sehingga mempermudah penggunanya untuk mencari data-data yang mereka inginkan atau memindahkannya dari suatu website ke website miliknya sendiri.


Contoh lainnya teknik web scraping digunakan oleh aplikasi agregator berita seperti “BACA”, “Opera News”, “KURIO”, “LINE Today”, dll yang berisi kumpulan artikel dari berbagai macam sumber, aplikasi tersebut tidak menyalin data text dan gambar secara manual melainkan menggunakan cara otomatis seperti bot apabila ada artikel berita terbaru maka langsung otomatis terambil dan masuk ke aplikasi agregator tersebut.

        Namun biasanya teknik web scraping harus menggunakan bahasa pemograman dan tidak semua orang mengerti bahasa pemograman, berikut ini tutorial cara mudah mengambil data pada website dengan teknik web scraping tanpa koding.

3 Teknik Web Scraping

1.HTML Parsing

HTML parsing merupakan salah satu teknik yang sering digunakan dalam proses parsing atau penguraian data. Teknik ini dilakukan menggunakan Javascript dan menargetkan halaman HTML linear atau nested. Teknik ini dapat mengekstraksi data dengan cepat dan mudah. Beberapa data yang Anda dapat seperti tulisan, link, screen, dan lain-lain.

2.DOM Parsing

DOM atau Document Object Model menentukan gaya, struktur serta konten yang terkandung dalam file XML. Teknik DOM parsing biasanya digunakan ketika Anda ingin mendapatkan informasi lebih mendalam mengenai struktur halaman website. Anda dapat menggunakan DOM parser untuk mengumpulkan node yang berisi informasi dan mengekstrak data di dalamnya menggunakan sebuah alat seperti XPath.

3.Google Sheets

Google sheet sebenarnya dapat digunakan sebagai alat web scraping dasar. Anda dapat menggunakan formula khusus untuk mengekstrak data dari halaman web, kemudian mengimpornya langsung ke dalam Google sheet. Beberapa formula sheet yang dapat digunakan untuk web scraping di Google Sheet adalah ImportXML, ImportHTML, ImportFEED, dan ImportDATA.





Subscribe to receive free email updates:

0 Response to "Teknik Dasar Scraping Data dari Website Lain"