STBI

INFORMATION RETIVAL

Information Retrieval merupakan bagian dari computer science yang berhubungan dengan pengambilan informasi dari dokumen-dokumen yang didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. Berdasarkan referensi dijelaskan bahwa Information Retrieval merupakan suatu pencarian informasi (biasanya berupa dokumen) yang didasarkan pada suatu query (inputan user) yang diharapkan dapat memenuhi keinginan user dari kumpulan dokumen yang ada. Sedangkan, definisi query dalam Information Retrieval menurut referensi merupakan sebuah formula yang digunakan untuk mencari informasi yang dibutuhkan oleh user, dalam bentuk yang paling sederhana, sebuah query merupakan suatu keywords (kata kunci) dan dokumen yang mengandung keywords merupakan dokumen yang dicari dalam IRS.

Exercise 1.2

Consider these documents: Doc 1 breakthrough drug for schizophrenia Doc 2 new schizophrenia drug Doc 3 new approach for treatment of schizophrenia Doc 4 new hopes for schizophrenia patients

a. Draw the term-document incidence matrix for this document collection.

Doc 1 Doc 2 Doc 3 Doc 4
Breakthrougt 1 0 0 0
Drug 1 1 0 0
For 1 0 1 1
Schizophenia 1 1 1 1
New 0 1 1 1
Approach 0 0 1 0
Treatment 0 0 1 0
Of 0 0 1 0
Hopes 0 0 0 1
Patients 0 0 0 1

b. Draw the inverted index representation for this collection, as in Figure 1.3 (page 7)

 

 

 

 

 

 

 

 

 

Exercise 1.7 Recommend a query processing order for (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes) given the following postings list sizes:

Term Posting Size
Eyes 213312
Kaleidoscope 87009
Marmalade 107913
Skies 271658
Tangerine 46653
Trees 316812

 

(tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes) trees AND skies AND eyes

 

Exercise 1.10

INTERSECT(X,Y)

answer <– ( )

while X != NIL or Y != NIL

do if docID (X) = docID (Y)

then ADD(answer,docID(X))

X <– next (X)

Y <– next (Y)

else if docID (X) <>

then X <– next (X)

else Y <– next (Y)

return answer

Perbandingan Google dan Yahoo…

 

 

 

 

 

 

 

 

 

 

 

disini diketahui bahwa google lebih mengena tentang pencarian RAMA AND SINTA dibandingkan yahoo… Ini dibuktikan dengan seberapa dekat dan mengena tentang hasil yang didapat daripada yahoo…:D

Doc 1 Doc 2 Doc 3 Doc 4
  1. Belum ada komentar.
  1. No trackbacks yet.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

%d blogger menyukai ini: