Jumat, 22 September 2017

Intro to Text Processing: Regular Expression Using Python 3

Dalam beberapa tahun terakhir, telah terjadi pergeseran dramatis dalam penggunaan bahasa pemrograman khususnya untuk Data Science dan Machine Learning. Ini tidak selalu terjadi, namun satu dekade yang lalu pemikiran ini pasti banyak. Bahasa apa sih yang paling tepat untuk dunia Data Science?

Sekarang ini, banyak orang / organisasi menggunakan alat seperti Python / JavaScript untuk memecahkan kebutuhan datanya. Di sinilah Regular Expressions menjadi sangat berguna. Ekspresi reguler biasanya merupakan cara pembersihan data. Jadi, itu dilakukan ekstraksi bagian teks tertentu dari halaman web, seperti data twitter atau persiapan data yang akan digunakan untuk penambangan teks. Ekspresi reguler adalah tools terbaik untuk semua tugas ini.

Dengan penerapannya, masuk akal untuk mengenal mereka dan menggunakannya dengan tepat.

Apa yang akan dipelajari dari artikel ini?

Pada artikel ini, saya akan memandu Anda melalui penggunaan, contoh dan aplikasi Regular Expressions. Regular Expression sangat populer di kalangan programmer dan dapat diterapkan dalam banyak bahasa pemrograman seperti Python, R, Java, JS, php, C ++ dll. Untuk mengembangkan pemahaman kita, kita akan menjelaskan konsep ini dengan menggunakan bahasa pemrograman Python.

Apa itu Regular Expression dan bagaimana penggunaannya?

Sederhananya, ekspresi reguler adalah urutan karakter (atau karakter-karakter) yang terutama digunakan untuk mencari dan mengganti pola dalam sebuah string atau file. Seperti yang saya sebutkan sebelumnya, mereka didukung oleh sebagian besar bahasa pemrograman seperti python, perl, R, Java dan banyak lainnya. Jadi, mempelajari regex membantu dalam banyak hal (lebih lanjut tentang ini nanti).

Ekspresi reguler menggunakan dua jenis karakter:
  1. Meta characters: Seperti namanya, karakter ini memiliki arti khusus, mirip dengan * wild card.
  2. Literals (seperti a, b, 1,2 ...)
Dengan menggunakan Python, kita memiliki modul "re" yang menjalankan perintah-perintah ekspresi reguler. Jadi Anda perlu mengimpor library/module sebelum Anda dapat menggunakan ekspresi reguler dengan Python. Untuk melakukan import lihat code berikut:

import re
Penggunaan regular regular expression yang paling umum adalah:
  • Cari string (pencarian dan kecocokan)
  • Menemukan string (findall)
  • Pecah string menjadi sub string (split)
  • Ganti bagian dari sebuah string (sub)
Mari kita lihat metode yang digunakan oleh module "re" untuk berbagai task. Bisa didownload di github bebentuk zip atau dapat melakukan clone dengan menggunakan git bash dengan code berikut:

git clone https://github.com/adeihsanhidayatullah/ESW.git
Catatan !!

Materi ini telah di presentasikan di Enthusiastics Statistics Weekend 2017 Statistika Universitas Islam Indonesia

Pada artikel ini, kita membahas tentang ekspresi reguler. Kami juga memberikan berbagai contoh untuk melihat kegunaan praktisnya. Di sini saya telah mencoba mengenalkan Anda dengan ekspresi reguler dan mencakup metode yang paling umum untuk memecahkan masalah ekspresi reguler.

Apakah artikel ini berguna? Beri tahu kami pendapat Anda tentang artikel ini di bagian komentar di bawah ini.

1 komentar:

  1. Olah Data Semarang
    Jasa Olah Data SPSS, AMOS, LISREL, Frontier 4.1
    EVIEWS, SMARTPLS, STATA, DEAP 2.1, DLL
    Contact Person WhatsApp
    Klik Link Dibawah
    Contact Person WhatsApp +6285227746673

    BalasHapus