EMAIL: PASSWORD:
Front Office
UPT. PERPUSTAKAAN
Institut Teknologi Sepuluh Nopember Surabaya


Kampus ITS Sukolilo - Surabaya 60111

Phone : 031-5921733 , 5923623
Fax : 031-5937774
E-mail : libits@its.ac.id
Website : http://library.its.ac.id

Support (Customer Service) :
timit_perpus@its.ac.id




Welcome..guys!

Have a problem with your access?
Please, contact our technical support below:
LIVE SUPPORT


Moh. Fandika Aqsa


Davi Wahyuni


Tondo Indra Nyata


Anis Wulandari


Ansi Aflacha




ITS » Paper and Presentation » Teknik Informatika - S2
Posted by aprill@is.its.ac.id at 09/01/2014 14:31:35  •  1429 Views


KNOWLEDGE DICTIONARY UNTUK EKSTRAKSI INFORMASI PADA DATA TEKS ARAB

KNOWLEDGE DICTIONARY FOR INFORMATION EXTRACTION IN ARABIC DATA TEXT

Author :
SAPUTRA, WAHYU SYAIFULLAH JAUHARIS ( 5110201028 )




ABSTRAK

Ekstraksi informasi merupakan sebuah tahap awal dari proses analisa data tekstual. Ekstraksi informasi diperlukan untuk mendapatkan informasi dari data tekstual sehingga dapat digunakan untuk proses analisa seperti misalnya klasifikasi dan kategorisasi. Data tekstual sangat dipengaruhi oleh bahasaseperti misalnya data tekstual berbahasa arab yang sangat berbeda dengan bahasa yang lain penelitian dan tools bahasa Arab masih sedikit. Knowledge dictionary merupakan sebuah kamus yang dapat digunakan untuk mengekstraksi informasi dari data tekstual.Informasi yang diekstraksi menggunakan knowledge dictionary adalah konsep. Knowledge dictionary biasanya dibangun secara manual oleh seorang pakar yang tentunya membutuhkan waktu yang lama dan spesifik untuk setiap masalah. Pada penelitian ini diusulkan sebuah metode untuk membangun knowledge dictionary secara otomatis. Pembentukan knowledge dictionary dilakukan dengan cara mengelompokkan kalimat yang memiliki konsep yang sama dengan asumsi kalimat yang memiliki konsep yang sama akan memiliki nilai similaritas yang tinggi. Konsep yang telah diekstraksi dapat digunakan sebagai fitur untuk proses komputasi berikutnya misalnya klasifikasi ataupun kategorisasi. Dataset yang digunakan dalam penelitian ini adalah dataset teksarab. Hasil ekstraksi diuji dengan menggunakan mesin klasifikasi decision tree dan didapatkan nilai presisi tertinggi 710 dan nilai recall tertinggi 750 .


ABSTRACT

Information extraction is an early stage of the process of textual data analysis. Infromation extraction required to get information from textual data that can be used for process analysis such as classification and categorization. Textual data is strongly influenced by the language such as Arabic are gaining significant attention in many studies because of the Arabic language is very different from the others and in contrast to other languages tools and research on the Arabic language is still lacking. Knowledge dictionary is a dictionary that can be used to extract information from textual data. The information is extracted using the knowledge dictionary is concept from expression. Knowledge dictionary usually constructed manually by an expert who would take a long time and specific to each problem. In this study proposed a method for automatically building a knowledge dictionary. Dictionary knowledge formation is done by classifying sentences that have the same concept assuming that the sentence has the same concept will have a high similarity value. Concept that has been extracted can be used as features for subsequent computational process such classification or categorization. Dataset used in this study is the Arabic text dataset. Extraction was tested by using decision tree classification engine and obtained the highest value of 71.0 precision and high recall value of 75.0.



KeywordsEkstraksi Informasi; knowladge dictionary; key concept dictionary; teks arab
 
Subject:  data pertambangan pengetahuan manajemen
Contributor
  1. Dr. Agus Zainal Arifin, S.Kom., M.Kom.
  2. Anny Yuniarti, S.Kom., M.Comp.Sc
Date Create: 09/01/2014
Type: Text
Format: pdf
Language: Indonesian
Identifier: ITS-paper-51021140003322
Collection ID: 51021140003322
Call Number: RTIf 006.312 Sap k


Source
Paper and Presentation of Informatics Engineering, RTIf 006.312 Sap k, 2014

Coverage
ITS Community

Rights
Copyright @2014 by ITS Library. This publication is protected by copyright and per obtained from the ITS Library prior to any prohibited reproduction, storage in a re transmission in any form or by any means, electronic, mechanical, photocopying, reco For information regarding permission(s), write to ITS Library




[ Download - Summary ]

ITS-paper-51021140003322-28936.pdf




 Similar Document...




! ATTENTION !

To facilitate the activation process, please fill out the member application form correctly and completely

Registration activation of our members will process up to max 24 hours (confirm by email). Please wait patiently

POLLING

Bagaimana pendapat Anda tentang layanan repository kami ?

Bagus Sekali
Baik
Biasa
Jelek
Mengecewakan





You are connected from 35.172.100.232
using CCBot/2.0 (https://commoncrawl.org/faq/)



Copyright © ITS Library 2006 - 2019 - All rights reserved.
Dublin Core Metadata Initiative and OpenArchives Compatible
Developed by Hassan