Senin, 06 Oktober 2014

#Pinternet Search Engine



Sebuah mesin pencari web adalah sistem perangkat lunak yang dirancang untuk mencari informasi di World Wide Web. Hasil pencarian umumnya disajikan dalam garis hasil sering disebut sebagai halaman hasil mesin pencari (SERPs). Informasi ini mungkin campuran halaman web, gambar, dan jenis file lainnya. Beberapa mesin pencari juga tambang data yang tersedia dalam database atau direktori terbuka. Tidak seperti direktori web, yang diselenggarakan hanya oleh editor manusia, mesin pencari juga memelihara informasi real-time dengan menjalankan algoritma pada web crawler.
Selama perkembangan awal web, ada daftar webservers diedit oleh Tim Berners-Lee dan host di webserver CERN. Satu snapshot sejarah dari daftar tahun 1992 tetap, tetapi karena semakin banyak webservers pergi online daftar sentral tidak bisa lagi mengikuti. Di situs NCSA, server baru diumumkan dengan judul "Apa yang Baru!"
Alat pertama kali digunakan untuk mencari di Internet adalah Archie.  Nama singkatan "arsip" tanpa "v". Buku itu diciptakan pada tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter Deutsch, mahasiswa ilmu komputer di McGill University di Montreal. Program tersebut mendownload daftar direktori dari semua file yang terletak di publik anonymous FTP (File Transfer Protocol) situs, menciptakan database dicari nama file; Namun, Archie tidak indeks isi dari situs-situs tersebut karena jumlah data sangat terbatas itu bisa dengan mudah dicari secara manual.
Munculnya Gopher (diciptakan pada tahun 1991 oleh Mark McCahill di University of Minnesota) menyebabkan dua program pencarian baru, Veronica dan Jughead. Seperti Archie, mereka mencari nama file dan judul yang disimpan dalam sistem index Gopher. Veronica (Very Easy Rodent-Oriented Net Index-lebar untuk Arsip Komputerisasi) yang tersedia pencarian kata kunci dari judul yang paling Gopher menu di seluruh daftar Gopher. Jughead (Jonzy Universal Gopher Hierarchy Penggalian Dan Display) adalah alat untuk memperoleh informasi menu dari server Gopher tertentu. Sedangkan nama mesin pencari "Archie" bukan mengacu pada seri buku komik Archie, "Veronica" dan "Jughead" adalah karakter dalam seri, sehingga referensi pendahulu mereka.
Pada musim panas tahun 1993, tidak ada mesin pencari ada untuk web, meskipun banyak katalog khusus yang dikelola oleh tangan. Oscar Nierstrasz di Universitas Jenewa menulis serangkaian script Perl yang secara berkala cermin halaman ini dan menulis ulang mereka ke dalam format standar. Ini membentuk dasar untuk W3Catalog, pertama mesin pencari primitif Web, dirilis pada tanggal 2 September 1993
Pada Juni 1993, Matthew Gray, kemudian di MIT, menghasilkan apa mungkin robot web pertama, World Wide Web Wanderer Perl berbasis, dan menggunakannya untuk menghasilkan indeks yang disebut 'Wandex'. Tujuan dari Wanderer adalah untuk mengukur ukuran dari World Wide Web, yang hal itu sampai akhir 1995 kedua Aliweb mesin pencari web muncul pada bulan November 1993 Aliweb tidak menggunakan web robot, tetapi bergantung pada diberitahu oleh website administrator dari keberadaan di setiap lokasi dari file indeks dalam format tertentu.
JumpStation (dibuat pada Desember 1993 oleh Jonathon Fletcher) menggunakan robot web untuk mencari halaman web dan untuk membangun indeks, dan menggunakan formulir web sebagai antarmuka program query nya. Karena itu, itu yang pertama alat sumber daya penemuan WWW untuk menggabungkan tiga fitur penting dari mesin pencari web (merangkak, pengindeksan, dan mencari) seperti yang dijelaskan di bawah ini. Karena sumber daya terbatas yang tersedia pada platform itu terus berlari, pengindeksan dan karenanya searching terbatas pada judul dan judul ditemukan di halaman web crawler yang dihadapi.
Salah satu yang pertama "semua teks" mesin pencari berbasis crawler adalah WebCrawler, yang keluar pada tahun 1994 seperti pendahulunya, ini memungkinkan pengguna untuk mencari setiap kata dalam setiap halaman web, yang telah menjadi standar untuk semua mesin pencari utama sejak. Itu juga yang pertama dikenal secara luas oleh masyarakat. Juga pada tahun 1994, Lycos (yang dimulai di Carnegie Mellon University) diluncurkan dan menjadi usaha komersial yang cukup besar.
Segera setelah itu, banyak mesin pencari muncul dan bersaing memperebutkan popularitas. Ini termasuk Magellan, Excite, Infoseek, Inktomi, Northern Light, dan AltaVista. Yahoo! merupakan salah satu cara yang paling populer bagi orang untuk menemukan halaman web yang menarik, namun fungsi pencarian dioperasikan pada direktori web, bukan salinan teks lengkap nya halaman web. Pencari informasi juga bisa menelusuri direktori bukannya melakukan pencarian kata kunci berbasis.
Google mengadopsi ide menjual istilah pencarian pada tahun 1998, dari sebuah perusahaan mesin pencari kecil bernama goto.com. Langkah ini memiliki efek yang signifikan pada bisnis SE, yang pergi dari berjuang untuk salah satu bisnis yang paling menguntungkan di internet.
Pada tahun 1996, Netscape sedang mencari untuk memberikan mesin pencari tunggal kesepakatan eksklusif sebagai mesin pencari ditampilkan di web browser Netscape. Ada begitu banyak bunga bahwa alih-alih Netscape perjanjian dengan lima dari mesin pencari utama: sebesar $ 5 juta per tahun, masing-masing mesin pencari akan di rotasi pada halaman mesin pencari Netscape. Lima mesin yang Yahoo !, Magellan, Lycos, Infoseek, dan Excite.
Mesin pencari juga dikenal sebagai beberapa bintang cemerlang dalam perlombaan investasi Internet yang terjadi pada akhir 1990-an. Beberapa perusahaan memasuki pasar spektakuler, menerima keuntungan catatan selama penawaran umum perdana mereka. Beberapa telah dibawa turun mesin pencari publiknya, dan hanya memasarkan edisi enterprise saja, seperti Northern Light. Banyak perusahaan mesin pencari yang terperangkap dalam gelembung dot-com, ledakan pasar spekulasi-driven yang memuncak pada tahun 1999 dan berakhir pada tahun 2001
Sekitar tahun 2000, mesin pencari Google bangkit untuk menonjol.  Perusahaan mencapai hasil yang lebih baik bagi banyak pencarian dengan inovasi bernama PageRank, seperti yang dijelaskan dalam Anatomi kertas dari Search Engine yang ditulis oleh Sergey Brin dan Larry Page, pendiri kemudian Google algoritma iteratif ini peringkat halaman web berdasarkan jumlah dan PageRank dari situs web lain dan halaman yang memiliki pranala sana, pada premis bahwa situs yang diinginkan terkait dengan lebih dari yang lain. Google juga mempertahankan antarmuka minimalis dengan mesin pencari. Sebaliknya, banyak pesaingnya tertanam mesin pencari di portal web. Bahkan, mesin pencari Google menjadi sangat populer sehingga mesin spoof muncul seperti Mystery Seeker.
Pada tahun 2000, Yahoo! telah menyediakan layanan pencarian berdasarkan mesin pencari Inktomi ini. Yahoo! mengakuisisi Inktomi pada tahun 2002, dan Overture (yang dimiliki AlltheWeb dan Altavista) pada tahun 2003 Yahoo! beralih ke mesin pencari Google sampai tahun 2004, ketika meluncurkan mesin pencari sendiri didasarkan pada teknologi gabungan dari rencana akusisi tersebut.
Microsoft pertama kali diluncurkan MSN Search pada musim gugur 1998 menggunakan hasil pencarian dari Inktomi. Pada awal tahun 1999 situs mulai menampilkan daftar dari Looksmart, dicampur dengan hasil dari Inktomi. Untuk waktu yang singkat pada tahun 1999, MSN Search digunakan hasil dari AltaVista yang sebaliknya. Pada tahun 2004, Microsoft mulai transisi ke teknologi pencarian sendiri, didukung oleh web crawler sendiri (disebut msnbot).
Namanya mesin pencari Microsoft, Bing, diluncurkan pada 1 Juni, 2009 Pada tanggal 29 Juli 2009, Yahoo! dan Microsoft menyelesaikan kesepakatan di mana Yahoo! Pencarian akan didukung oleh teknologi Microsoft Bing.

Berbasis agama Search Engine
Pertumbuhan global Internet dan popularitas isi elektronik di Arab dan Muslim Dunia selama dekade terakhir telah mendorong penganut iman, terutama di Timur Tengah dan Asia sub-benua, untuk "mimpi" dari berbasis agama sendiri yaitu mereka "Islam "mesin atau disaring portal pencarian filter yang akan memungkinkan pengguna untuk mengakses situs-situs terlarang menghindari seperti pornografi dan hanya akan memungkinkan mereka untuk mengakses situs yang kompatibel dengan keyakinan Islam pencarian. Sesaat sebelum bulan hanya Ramadhan, Halalgoogling yang mengumpulkan hasil dari mesin pencari lain seperti Google dan Bing diperkenalkan ke dunia Juli 2013 untuk menyajikan hasil halal para penggunanya,  hampir dua tahun setelah I'mHalal, pencarian lain mesin awalnya (diluncurkan pada September 2011) untuk melayani Timur Tengah Internet harus menutup layanan pencarian karena apa pemiliknya disalahkan pada kurangnya dana.
Sementara kurangnya investasi dan kecepatan lambat dalam teknologi di dunia Muslim sebagai konsumen utama atau pengguna akhir yang ditargetkan telah menghambat kemajuan dan menggagalkan keberhasilan mesin pencari Islam yang serius, kegagalan spektakuler berinvestasi proyek web gaya hidup Muslim seperti Muxlim, yang menerima jutaan dolar dari investor seperti Rite Internet Ventures, telah - menurut shutdown pemberitahuan I'mHalal - membuat hampir menggelikan gagasan bahwa Facebook berikutnya atau Google hanya dapat datang dari Timur Tengah jika Anda mendukung pemuda cerdas Anda pakar internet Namun Muslim. telah menentukan selama bertahun-tahun apa yang atau tidak diperbolehkan menurut "Hukum Islam" dan telah mengkategorikan situs web dan seperti menjadi ada baik "halal" atau "haram". Semua yang ada dan mesin pencari Islam masa lalu yang hanya Custom Search diindeks atau menghasilkan uang dengan web raksasa pencari utama seperti Google, Yahoo dan Bing dengan sistem penyaringan tertentu saja diterapkan untuk memastikan bahwa pengguna mereka tidak dapat mengakses situs Haram, yang termasuk situs seperti ketelanjangan , gay, perjudian atau apapun yang dianggap anti-Islam.
Lain mesin pencari agama berorientasi Jewogle, yang merupakan versi Yahudi Google dan yang lain lagi adalah SeekFind.org, yang merupakan situs Kristen yang mencakup filter mencegah pengguna dari melihat apa-apa di internet yang menyerang atau merendahkan iman mereka
Bagaimana web mesin pencari kerja
Bagian ini mungkin mengandung riset asli. Silakan memperbaikinya dengan memverifikasi klaim yang dibuat dan menambahkan kutipan inline. Laporan hanya terdiri dari riset asli harus dihapus. (Oktober 2013)
Artikel ini membutuhkan tambahan kutipan untuk verifikasi. Silakan bantu memperbaiki artikel ini dengan menambahkan kutipan ke sumber terpercaya. Disertai rujukan bahan mungkin sulit dan dihapus. (Juli 2013)
Sebuah mesin pencari beroperasi dalam urutan berikut:
     web crawling
     Indexing
     Searching

Mesin pencari web bekerja dengan menyimpan informasi tentang banyak halaman web, yang mereka mengambil dari markup HTML halaman. Halaman ini akan diambil oleh crawler Web (kadang-kadang juga dikenal sebagai laba-laba) - sebuah crawler Web otomatis yang mengikuti setiap link di situs. Pemilik situs dapat mengecualikan halaman tertentu dengan menggunakan robots.txt.
Mesin pencari kemudian menganalisa isi dari setiap halaman untuk menentukan bagaimana harus diindeks (misalnya, kata-kata dapat diambil dari judul, isi halaman, judul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebuah query dari pengguna dapat menjadi satu kata. Indeks ini membantu menemukan informasi yang berkaitan dengan permintaan secepat mungkin. Beberapa mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (disebut sebagai cache) maupun informasi tentang halaman web, sedangkan lain, seperti AltaVista, menyimpan setiap kata dari setiap halaman yang mereka temukan. [rujukan?] halaman cache ini selalu memegang pencarian teks yang sebenarnya karena merupakan salah satu yang sebenarnya diindeks, sehingga dapat sangat berguna bila konten dari saat ini halaman telah diperbarui dan istilah pencarian tidak lagi di dalamnya. masalah ini mungkin dianggap bentuk ringan dari linkrot, dan penanganan Google itu meningkatkan kegunaan dengan memenuhi harapan pengguna bahwa istilah pencarian akan berada di halaman web kembali. Ini memenuhi prinsip paling keheranan, karena pengguna biasanya mengharapkan bahwa istilah pencarian akan berada di halaman kembali. Peningkatan relevansi pencarian membuat halaman-halaman cache sangat berguna karena mereka mungkin berisi data yang mungkin tidak lagi tersedia di tempat lain.

Arsitektur tingkat tinggi dari Web crawler standar
Ketika pengguna memasukkan query ke mesin pencari (biasanya dengan menggunakan kata kunci), mesin memeriksa indeks dan memberikan daftar terbaik-cocok halaman web sesuai dengan kriteria, biasanya dengan ringkasan singkat berisi judul dan kadang-kadang bagian dokumen tentang teks. Indeks dibangun dari informasi yang tersimpan dengan data dan metode yang informasi diindeks.]Dari 2.007 mesin pencari Google.com telah memungkinkan orang untuk mencari menurut tanggal dengan mengklik "Tampilkan perangkat pencarian" di kolom paling kiri dari halaman hasil pencarian awal, dan kemudian memilih rentang tanggal yang diinginkan. Kebanyakan mesin pencari mendukung penggunaan operator boolean AND, OR dan NOT untuk lebih menentukan permintaan pencarian. Operator Boolean adalah untuk pencarian literal yang memungkinkan pengguna untuk memperbaiki dan memperpanjang jangka pencarian. Mesin mencari kata atau frasa persis seperti masuk. Beberapa mesin pencari menyediakan fitur canggih yang disebut pencarian kedekatan, yang memungkinkan pengguna untuk menentukan jarak antara kata kunci.  Ada juga pencarian berdasarkan konsep-mana penelitian melibatkan menggunakan analisis statistik pada halaman yang berisi kata atau frasa yang Anda cari. Selain itu, permintaan bahasa alami memungkinkan pengguna untuk mengetik pertanyaan dalam bentuk satu sama akan meminta untuk manusia. Sebuah situs seperti ini akan ask.com.
Kegunaan dari mesin pencari bergantung pada relevansi hasil set itu memberi kembali. Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frase, sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan metode untuk menentukan peringkat hasil untuk memberikan yang "terbaik" hasil pertama. Bagaimana mesin pencari yang memutuskan halaman yang paling cocok, dan apa memesan hasil harus ditampilkan dalam, sangat bervariasi dari satu mesin ke yang lain. Metode juga berubah dari waktu ke waktu sebagai perubahan penggunaan internet dan teknik baru berkembang. Ada dua jenis utama mesin pencari yang telah berevolusi: satu adalah sistem kata kunci standar dan hirarki memerintahkan bahwa manusia telah diprogram secara ekstensif. Yang lainnya adalah sistem yang menghasilkan "indeks terbalik" dengan menganalisis teks ini menempatkan. Bentuk pertama ini bergantung jauh lebih berat pada komputer itu sendiri untuk melakukan sebagian besar pekerjaan.
Kebanyakan mesin pencari web adalah usaha komersial yang didukung oleh pendapatan dari iklan dan dengan demikian beberapa dari mereka memungkinkan pengiklan untuk memiliki daftar mereka peringkat tinggi dalam hasil pencarian untuk biaya. Search engine yang tidak menerima uang untuk hasil pencarian mereka menghasilkan uang dengan menjalankan iklan pencarian terkait di samping hasil mesin pencarian biasa. Mesin pencari menghasilkan uang setiap kali seseorang mengklik salah satu iklan tersebut.
Pangsa pasar
Google adalah mesin pencari paling populer di dunia, dengan pangsa pasar dari 68,69 persen. Baidu datang  kedua , menjawab pertanyaan secara online 17.17 per sen.
Mesin pencari paling populer di dunia adalah:
Cari share mesin Pasar di Juli 2014
Google 68,69%
Baidu 17,17%
Yahoo! 6.74%
Bing 6.22%
Excite 0,22%
Tanyakan 0,13%
AOL 0,13%

Asia Timur dan Rusia
Negara-negara Asia Timur dan Rusia merupakan beberapa tempat di mana Google tidak mesin pencari paling populer. Soso (mesin pencari) lebih populer daripada Google di Cina.
Yandex perintah pangsa pasar dari 61,9 persen di Rusia, dibandingkan dengan Google 28,3 persen. Di Cina, Baidu adalah mesin pencari paling populer. portal pencarian homegrown Korea Selatan, Naver, digunakan untuk 70 persen secara online mencari di negara ini.Yahoo! Jepang dan Taiwan Yahoo! adalah jalan paling populer untuk pencarian internet di Jepang dan Taiwan, masing-masing.

Bias Search engine
Meskipun mesin pencari diprogram untuk website peringkat didasarkan pada beberapa kombinasi popularitas mereka dan relevansi, studi empiris menunjukkan berbagai bias politik, ekonomi, dan sosial dalam informasi yang mereka berikan.  bias ini bisa menjadi akibat langsung dari ekonomi dan proses komersial (misalnya, perusahaan yang beriklan dengan mesin pencari dapat menjadi juga lebih populer di hasil pencarian organik), dan proses politik (misalnya, penghapusan hasil pencarian untuk mematuhi hukum setempat).
Bias juga dapat menjadi hasil dari proses sosial, karena algoritma mesin pencari sering dirancang untuk mengecualikan sudut pandang non-normatif mendukung lebih "populer" hasilalgoritma Indexing dari mesin pencari utama condong ke arah cakupan situs yang berbasis di AS, bukan situs dari negara-negara non-AS.
Google Bom adalah salah satu contoh upaya untuk memanipulasi hasil pencarian karena alasan politik, sosial atau komersial.

Hasil dan gelembung penyaring Disesuaikan
Banyak mesin pencari seperti Google dan Bing memberikan hasil disesuaikan berdasarkan sejarah aktivitas pengguna. Hal ini menyebabkan efek yang telah disebut gelembung filter. Istilah menggambarkan fenomena di mana situs web menggunakan algoritma untuk selektif menebak informasi apa yang pengguna ingin melihat, berdasarkan informasi tentang user (seperti lokasi, perilaku klik masa lalu dan riwayat penelusuran). Akibatnya, situs cenderung hanya menampilkan informasi yang setuju dengan sudut pandang masa lalu pengguna, secara efektif mengisolasi pengguna dalam gelembung yang cenderung untuk mengecualikan informasi sebaliknya. Perdana contoh adalah hasil personalisasi pencarian Google dan Facebook aliran berita personal. Menurut Eli Pariser, yang menciptakan istilah, pengguna mendapatkan pencahayaan yang lebih sedikit untuk sudut pandang yang bertentangan dan terisolasi intelektual dalam gelembung informasi mereka sendiri. Pariser terkait contoh di mana satu pengguna mencari Google untuk "BP" dan mendapat berita tentang investasi British Petroleum sementara pencari lain mendapat informasi tentang tumpahan minyak Deepwater Horizon dan bahwa dua halaman hasil pencarian yang "sangat berbeda".  efek gelembung mungkin memiliki implikasi negatif untuk wacana sipil, menurut Pariser.
Karena masalah ini telah diidentifikasi, bersaing mesin pencari telah muncul yang berusaha untuk menghindari masalah ini dengan tidak melacak atau "menggelegak" pengguna

Sumber :

World-Wide Web Servers". W3.org. Retrieved 2012-05-14.
"What's New! February 1994". Home.mcom.com. Retrieved 2012-05-14.
"Internet History - Search Engines" (from Search Engine Watch), Universiteit Leiden, Netherlands, September 2001, web: LeidenU-Archie.
Oscar Nierstrasz (2 September 1993). "Searchable Catalog of WWW Resources (experimental)".
"Archive of NCSA what's new in December 1993 page". Web.archive.org. 2001-06-20. Archived from the original on 2001-06-20. Retrieved 2012-05-14.
"Yahoo! And Netscape Ink International Distribution Deal"
Browser Deals Push Netscape Stock Up 7.8%. Los Angeles Times. 1 April 1996
Gandal, Neil (2001). "The dynamics of competition in the internet search engine market". International Journal of Industrial Organization 19 (7): 1103–1117. doi:10.1016/S0167-7187(01)00065-0.
"Our History in depth". W3.org. Retrieved 2012-10-31.
Brin, Sergey; Page, Larry. "The Anatomy of a Large-Scale Hypertextual Web Search Engine".
"New Islam-approved search engine for Muslims". News.msn.com. Retrieved 2013-07-11.
I’mHalal - Islamic compliant search project launched September 2009 and shut down late 2011
I'mHalal Blog
I'mHalal Blog
AllChristianNews
Jawadekar, Waman S (2011), "8. Knowledge Management: Tools and Technology", Knowledge Management: Text & Cases, New Delhi: Tata McGraw-Hill Education Private Ltd, p. 278, ISBN 978-0-07-07-0086-4, retrieved November 23, 2012
"FAQ". RankStar. Retrieved 19 June 2013.
"Desktop Search Engine Market Share". NetMarketShare. Retrieved 2014-06-04.
"Live Internet - Site Statistics". Live Internet. Retrieved 2014-06-04.
Arthur, Charles (2014-06-03). "The Chinese technology companies poised to dominate the world". The Guardian. Retrieved 2014-06-04.
"How Naver Hurts Companies’ Productivity". The Wall Street Journal. 2014-05-21. Retrieved 2014-06-04.
"Age of Internet Empires". Oxford Internet Institute. Retrieved 2014-06-04.
Segev, El (2010). Google and the Digital Divide: The Biases of Online Knowledge, Oxford: Chandos Publishing.
Vaughan, Liwen; Mike Thelwall (2004). "Search engine coverage bias: evidence and possible causes". Information Processing & Management 40 (4): 693–707. doi:10.1016/S0306-4573(03)00063-3.
Berkman Center for Internet & Society (2002), “Replacement of Google with Alternative Search Systems in China: Documentation and Screen Shots”, Harvard Law School.
Introna, Lucas; Helen Nissenbaum (2000). "Shaping the Web: Why the Politics of Search Engines Matters". The Information Society: An International Journal 16 (3). doi:10.1080/01972240050133634.
Parramore, Lynn (10 October 2010). "The Filter Bubble". The Atlantic. Retrieved 2011-04-20. "Since Dec. 4, 2009, Google has been personalized for everyone. So when I had two friends this spring Google "BP," one of them got a set of links that was about investment opportunities in BP. The other one got information about the oil spill...."
Weisberg, Jacob (10 June 2011). "Bubble Trouble: Is Web personalization turning us into solipsistic twits?". Slate. Retrieved 2011-08-15.
Gross, Doug (May 19, 2011). "What the Internet is hiding from you". CNN. Retrieved 2011-08-15. "I had friends Google BP when the oil spill was happening. These are two women who were quite similar in a lot of ways. One got a lot of results about the environmental consequences of what was happening and the spill. The other one just got investment information and nothing about the spill at all."
Zhang, Yuan Cao; Séaghdha, Diarmuid Ó; Quercia, Daniele; Jambor, Tamas (February 2012). "Auralist: Introducing Serendipity into Music Recommendation". ACM WSDM.
 

Tidak ada komentar:

Posting Komentar