EMAIL: PASSWORD:
Front Office
UPT. PERPUSTAKAAN
Institut Teknologi Sepuluh Nopember Surabaya


Kampus ITS Sukolilo - Surabaya 60111

Phone : 031-5921733 , 5923623
Fax : 031-5937774
E-mail : libits@its.ac.id
Website : http://library.its.ac.id

Support (Customer Service) :
timit_perpus@its.ac.id




Welcome..guys!

Have a problem with your access?
Please, contact our technical support below:
LIVE SUPPORT


Moh. Fandika Aqsa


Davi Wahyuni


Tondo Indra Nyata


Anis Wulandari


Ansi Aflacha




ITS » Undergraduate Theses » Teknologi Informasi - D4
Posted by ansi@its.ac.id at 27/05/2011 13:29:33  •  2028 Views


RANCANG BANGUN APLIKASI SERVER CRAWLING BERITA ONLINE SEBAGAI PENYEDIA BERITA UP TO DATE PADA HANDPHONE YANG MENDUKUNG WAP

THE DEVELOPING OF ONLINE NEWS CRAWLING SERVER FOR NEWS PROVIDER USING WAP TECHNLOLOGY

Author :
BADRULLAMI, MOH  ( 7406040042 )




ABSTRAK

Berita merupakan sesuatu hal yang memiliki peranan penting dalam kehidupan manusia. Karena manusia hidup pasti membutuhkan sebuah informasi Seseorang bisa mengakses berita melalui berbagai media antara lain media cetak media elektronik dan media internet. Kebanyakan orang menginginkan sebuah berita dapat diakses di mana saja dan kapan saja Oleh karena itu timbul sebuah pemikiran bagaimana menjadikan berita itu menjadi portable. Pada proyek akhir ini akan dibangun sebuah aplikasi server yang bertugas untuk crawling berita dan memanage nya berita tersebut ditujukan kepada mobile user seperti hanphone. Tujuan dari proyek akhir ini yakni memberikan kemudahan bagi pengguna handphone untuk mendapatkan berita-berita terbaru dari situs penyedia berita di internet. Dengan memanfaatkan fitur RSS dari situs sistem akan mendapatkan berita yang terbaru dari situs tersebut. Kemudian mencari berita secara lengkap dengan mengambil konten halaman di dalam link hasil dokumen RSS. Berita yang masih melekat pada dokumen HTML akan dipisahkan dengan menggunakan metode RegEx atau Reguler Expression. Kemudian berita dikategorikan dengan menggunakan proses text mining dan analisis korelasi. Pada perhitungan korelasi yang menjadi variable adalah dokumen berita dan dokumen kategori yang telah disediakan oleh sistem. Kemudian disimpan ke dalam database yang kemudian akan diakses oleh server WML. Hasil yang diharapkan adalah akses berita ke server WML dengan load data yang lebih cepat dibandingkan dengan akses langsung ke situs aslinya. Dan pengkategorian berita dengan tingkat error 20 sampai dengan 30.


ABSTRACT

News is an important role in human life. Because people always require information person can access the news through various media including print media electronic media and Internet media. Most people want a piece of news can be accessed anywhere and anytime then arose an idea how to make the news becomes portable.In this final project will develop a server application responsible for crawling and manage news News was addressed to the mobile user such as a cell phone. The aim of this project which provides convenience for mobile phone users to get the latest news from the site on the internet news provider. By utilizing the RSS feature of the site the system will get the latest news from the site. Then look for the complete news by taking the content page in the link results RSS document. News that is still embedded in HTML documents will be separated by using RegEx or Regular Expression. Then the news is categorized by using text mining and correlation analysis. The calculation of the correlation which becomes variable is the news and categories of documents that have been provided by the system. Then stored into the database which will be accessed by a WML server The expected result is the news access to the WML server with load data faster than with direct access to the original site. And categorization of news with an error rate of 20 to 30.



Keywordsnews; rss; regex; text mining; correlation analysis; wml
 
Subject:  komputer digital
Contributor
  1. IDRIS WINARNO, S.ST, M.Kom
  2. ENTIN MARTIANA K., S.Kom, M.Kom
Date Create: 09/08/2010
Type: Text
Format: pdf
Language: Indonesian
Identifier: ITS-Undergraduate-3100010041147
Collection ID: 3100010041147
Call Number: RSEP 004.62 Bad r


Source
Undergraduate Thesis, Informatics, RSEP 004.62 Bad r, 2010

Coverage
ITS Community

Rights
Copyright @2010 by ITS Library. This publication is protected by copyright and per obtained from the ITS Library prior to any prohibited reproduction, storage in a re transmission in any form or by any means, electronic, mechanical, photocopying, reco For information regarding permission(s), write to ITS Library




[ Download - Open Access ]

  1.  ITS-Undergraduate-14637-abstract-idpdf.pdf - 108 KB
  2.  ITS-Undergraduate-14637-abstract-enpdf.pdf - 107 KB
  3.  ITS-Undergraduate-14637-conclusionpdf.pdf - 111 KB
  4.  ITS-Undergraduate-14637-paperpdf.pdf - 504 KB




 Similar Document...




! ATTENTION !

To facilitate the activation process, please fill out the member application form correctly and completely

Registration activation of our members will process up to max 24 hours (confirm by email). Please wait patiently

POLLING

Bagaimana pendapat Anda tentang layanan repository kami ?

Bagus Sekali
Baik
Biasa
Jelek
Mengecewakan





You are connected from 35.172.195.82
using CCBot/2.0 (https://commoncrawl.org/faq/)



Copyright © ITS Library 2006 - 2020 - All rights reserved.
Dublin Core Metadata Initiative and OpenArchives Compatible
Developed by Hassan