EMAIL: PASSWORD:
Front Office
UPT. PERPUSTAKAAN
Institut Teknologi Sepuluh Nopember Surabaya


Kampus ITS Sukolilo - Surabaya 60111

Phone : 031-5921733 , 5923623
Fax : 031-5937774
E-mail : libits@its.ac.id
Website : http://library.its.ac.id

Support (Customer Service) :
timit_perpus@its.ac.id




Welcome..guys!

Have a problem with your access?
Please, contact our technical support below:
LIVE SUPPORT


Moh. Fandika Aqsa


Davi Wahyuni


Tondo Indra Nyata


Anis Wulandari


Ansi Aflacha




ITS » Paper and Presentation » 51200-Teknik Informatika S2
Posted by fandikaaqsa@its.ac.id at 15/06/2015 18:41:22  •  1025 Views


PENGEMBANGAN SISTEM TEMU KEMBALI CITRA DENGAN MULTIMODAL DATA MENGGUNAKAN MICROSTRUCTURE DESCRIPTOR DAN PLSA

MULTIMODAL IMAGE RETRIEVAL SYSTEM DEVELOPMENT USING MICROSTRUCTURE DESCRIPTOR AND PLSA

Author :
ZA’IN, CHOIRU ( 5110201002 )




ABSTRAK

Perkembangan teknologi digital mendukung kemudahan pertukaran dan penyimpanan informasi khususnya citra digital pada media publik seperti flickr. Akan tetapi untuk mencari citra yang relevan pada basis data yang sangat besar merupakan sebuah tantangan. Content Based Image Retrieval CBIR adalah sistem yang menggunakan data visual atau tekstual untuk mendapatkan citra yang relevan dari basis data citra yang besar. Masing-masing informasi memiliki karakteristik tersendiri. Data tekstual diekstraksi dari deskripsi teks pengguna sedangkan data visual diekstraksi dari citra. Data tekstual tidak dapat mengartikan data visual begitu pula sebaliknya. Permasalahan ini disebut semantic gap. Probabilistic Latent Semantic Analysis PLSA adalah metode yang mengkombinasikan dua atau lebih data multimodal data pada proses pembelajarannya. PLSA menggunakan algoritma probabilitas dari matriks term-dokumen dan menghitung hubungan antara data visual dan data tekstual. Pada saat ini sistem temu kembali berbasiskan PLSA pada umumnya menggunakan Scale Invariant Feature Transform SIFT untuk mendapatkan data visual fitur dari citra. Akan tetapi SIFT memiliki 128 fitur vektor untuk setiap keypoint yang dihasilkan pada citra grayscale. Dengan demikian dimensi deskriptor yang dihasilkan akan menjadi sangat tinggi terutama untuk temu kembali pada basis data yang besar mengingat setiap citra menghasilkan banyak keypoint. Di sisi lain Micro Structure Descriptor MSD merupakan metode ekstraksi fitur pada citra yang berwarna hanya memiliki 72 dimensi fitur vektor. MSD juga memiliki informasi lain seperti warna tekstur dan bentuk. Hasil dari penelitian ini berupa sistem temu kembali citra dengan multimodal data menggunakan ekstraksi fitur MSD dan PLSA. Sistem in kemudian dibandingkan dengan sistem temu kembali citra menggunakan PLSA dan SIFT untuk evaluasi. Berdasarkan eksperimen yang telah dilakukan dapat ditarik empat hasil analisa. Pertama berdasarkan skenario pengujian sistem menggunakan data visual saja PLSA-MSD menghasilkan Mean Average precision MAP sekitar 10 lebih rendah daripada PLSA-SIFT. Kedua berdasarkan skenario pengujian sistem dengan memanfaatkan data visual dan data teks dapat meningkatkan MAP temu kembali sampai dengan 93 baik untuk PLSA-MSD maupun PLSA-SIFT. Ketiga berdasarkan skenario pengujian sistem dengan memanfaatkan auto anotasi PLSA-MSD memiliki MAP 3 lebih rendah daripada PLSASIFT. Keempat dari sisi kecepatan komputasi waktu yang dibutuhkan PLSA-MSD adalah tiga kali lebih cepatefektif daripada PLSA-SIFT. Dari hasil beberapa skenario di atas dapat diambil kesimpulan bahwa penggunaan ekstraksi fitur MSD menghasilkan temu kembali yang lebih efektif dalam hal kecepatan sistem akan tetapi data visual MSD belum dapat melebihi kinerja data visual SIFT dalam presisi.


ABSTRACT

Current digital technology provides easy and publicly available digital image storage and sharing medias such as Flickr. However searching relevant images from Flickr that stored millions images is a challenge. Content Based Image Retrieval CBIR is a system that uses either visual or textual information to get relevant images in a big image database. Each of the information has its own characteristic. Textual information is extracted from user textual description and visual information is extracted from the image. Textual information does not represent visual information and vice versa. This is called a semantic gap. Probabilistic Latent Semantic Analysis PLSA is a learning method that combines two or more data multimodal data in the learning process. In image retrieval PLSA uses probabilistic algorithms from term-document matrix and determine the correlation between visual information and textual information. Most of current PLSA based image retrieval systems use image feature extraction algorithm called Scale Invariant Feature Transform SIFT to extract the visual information feature from images. However in the SIFT each keypoint on gray-scale image has a 128 dimensional feature vector. This will lead to a very high dimensional descriptor for image retrieval on big database like Flickr since each image will have many keypoints. On the other hand in the Micro Structure Descriptor MSD each keypoint on full color image has only 72 dimensional feature vector. MSD also comprises the information about colours textures and shapes. This research has developed a PLSA based multimodal image retreival system using MSD feature extraction algorithm. This system has been compared to PLSA based multimodal image retreival system using SIFT feature extraction algorithm for evaluation. The experiments show four highlighted outputs. Firstly visual based only PLSA image retrieval on both MSD and SIFT extraction algorithms shows that PLSA-SIFT has around 10 better mean average precision MAP than PLSA-MSD. Secondly visual and PLSA image retrieval shows that both PLSA-SIFT and PLSA-MSD have similar MAP at 93. Additional text data in this scenario increases the MAP so that it is better than visual based only PLSA on both extraction algorithm. This MAP is better than visual based only PLSA on both extraction algorithms. Thirdly auto annotation based PLSA image retreival shows that PLSA-SIFT has 3 better MAP than PLSA-MSD. Fourthly based on computation time needed PLSA-MSD is three times faster than PLSA-SIFT. Based on those experiment results it can be concluded that eventough PLSA-MSD has slightly less mean average precision than PLSA-SIFT PLSA-MSD image retrieval system is much more effective than PLSA-SIFT in terms of computational speed.



KeywordsSIFT; MSD; PLSA; CBIR; multimodal data; anotasi otomatis
 
Subject:  Sistem penyimpanan dan temu kembali informasi; Perangkat lunak
Contributor
  1. Dr. Eng. Nanik Suciati, S.Kom, M.Kom
  2. Dr. Eng. Chastine Fatichah, S.Kom., M.Kom.
Date Create: 15/06/2015
Type: Text
Format: PDF
Language: Indonesian
Identifier: ITS-paper-51121150007664
Collection ID: 51121150007664
Call Number: RTIf 005.74 Zai p


Source
Paper and Presentations of Informatics Engineering, RTIf 005.74 Zai p, 2014

Coverage
ITS Community

Rights
Copyright @2015 by ITS Library. This publication is protected by copyright and per obtained from the ITS Library prior to any prohibited reproduction, storage in a re transmission in any form or by any means, electronic, mechanical, photocopying, reco For information regarding permission(s), write to ITS Library




[ Download - Summary ]

ITS-paper-51121150007664-37918.pdf




 Similar Document...




! ATTENTION !

To facilitate the activation process, please fill out the member application form correctly and completely

Registration activation of our members will process up to max 24 hours (confirm by email). Please wait patiently

POLLING

Bagaimana pendapat Anda tentang layanan repository kami ?

Bagus Sekali
Baik
Biasa
Jelek
Mengecewakan





You are connected from 34.226.244.70
using CCBot/2.0 (https://commoncrawl.org/faq/)



Copyright © ITS Library 2006 - 2020 - All rights reserved.
Dublin Core Metadata Initiative and OpenArchives Compatible
Developed by Hassan