Contoh lainnya teknik web scraping digunakan oleh aplikasi agregator berita seperti “BACA”, “Opera News”, “KURIO”, “LINE Today”, dll yang berisi kumpulan artikel dari berbagai macam sumber, aplikasi tersebut tidak menyalin data text dan gambar secara manual melainkan menggunakan cara otomatis seperti bot apabila ada artikel berita terbaru maka langsung otomatis terambil dan masuk ke aplikasi agregator tersebut.
Namun biasanya teknik web scraping harus menggunakan bahasa pemograman dan tidak semua orang mengerti bahasa pemograman, berikut ini tutorial cara mudah mengambil data pada website dengan teknik web scraping tanpa koding.
3 Teknik Web Scraping
1.HTML Parsing
HTML parsing merupakan salah satu teknik yang sering digunakan dalam proses parsing atau penguraian data. Teknik ini dilakukan menggunakan Javascript dan menargetkan halaman HTML linear atau nested. Teknik ini dapat mengekstraksi data dengan cepat dan mudah. Beberapa data yang Anda dapat seperti tulisan, link, screen, dan lain-lain.
2.DOM Parsing
DOM atau Document Object Model menentukan gaya, struktur serta konten yang terkandung dalam file XML. Teknik DOM parsing biasanya digunakan ketika Anda ingin mendapatkan informasi lebih mendalam mengenai struktur halaman website. Anda dapat menggunakan DOM parser untuk mengumpulkan node yang berisi informasi dan mengekstrak data di dalamnya menggunakan sebuah alat seperti XPath.
3.Google Sheets
Google sheet sebenarnya dapat digunakan sebagai alat web scraping dasar. Anda dapat menggunakan formula khusus untuk mengekstrak data dari halaman web, kemudian mengimpornya langsung ke dalam Google sheet. Beberapa formula sheet yang dapat digunakan untuk web scraping di Google Sheet adalah ImportXML, ImportHTML, ImportFEED, dan ImportDATA.
0 Response to "Teknik Dasar Scraping Data dari Website Lain"
Post a Comment