Các phương pháp tìm kiếm thông tin

Phải thừa nhận rằng thói quen lướt web đã bắt đầu được hình thành ở Việt Nam, trước hết là giới trẻ tại các thành phố lớn. Khi thức dậy vào mỗi buổi sáng thay vì  mua một tờ báo, bật đài hoặc ti vi để xem tin tức, chỉ bằng một cái nháy chuột “các thông tin sẽ tự tìm đến với bạn chứ bạn không phải đi tìm” (Tom Curley – Chủ tịch hãng tin AP).

Trên Internet, thông tin được tích luỹ và lưu trữ thành những kho khổng lồ giống như hàng ngàn, hàng vạn thư viện lớn nhất trên thế giới. Và nhờ có các siêu liên kết (hyperlink) mà thông tin có thể xâu chuỗi và tạo thành nhiều lớp khiến cho người truy cập có cảm giác như đi vào một hành lang dài vô tận.

Tuy có một kho thông tin khổng lồ như thế nhưng Internet lại cung cấp cho chúng ta các dịch vụ tìm kiếm thông tin khoa học và hiệu quả. Các dịch vụ này có thể giúp người đọc tìm thông tin theo chủ đề, theo ý muốn của mình một cách chóng vánh. Có thể kể ra đây các dịch vụ tìm kiếm trực tuyến đã trở nên quen thuộc đối với những người thường xuyên khai thác thông tin trên mạng Internet như: Google, Yahoo, Vinaseek… Những dịch vụ tìm kiếm này đang liên tục mở rộng tiện ích, không chỉ đem đến một cổng thông tin tổng hợp nhiều nguồn mà còn là một bộ dẫn hướng cực mạnh giúp người sử dụng không chỉ tiếp cận nội dung dạng văn bản (text) mà cả hình ảnh và âm thanh. Hãng thống kê truy cập Nielsen/NetRatings cho biết riêng tháng 5.2005, mạng tin tức Yahoo News đã đón nhận độc giả lên tới 23,8 triệu (tăng 3% so với năm ngoái) trong khi kênh tổng hợp thông tin của Google đạt 7,1 triệu khách (tăng 4%).

Ngoài những cái tên quen thuộc trên, tôi xin đưa ra đây địa chỉ của một số cơ chế tìm kiếm nổi tiếng và hiệu quả khác để các bạn tham khảo:

"http://www.hotbot.com" www.hotbot.com

"http://www.go.com" www.go.com

"http://www.excite.com" www.excite.com

"http://www.altavista.com" www.altavista.com

"http://www.goto.com" www.goto.com

"http://www.copernic.com" www.copernic.com

"http://www.northernlight.com" www.northernlight.com

"http://www.search.msn.com" www.search.msn.com

"http://www.looksmart.com" www.looksmart.com

"http://www.lycos.com" www.lycos.com

"http://www.search.aol.com" www.search.aol.com

"http://www.msn.com" www.msn.com

"http://www.kartoo.com" www.kartoo.com

"http://www.dmoz.org" www.dmoz.org

"http://www.raging.com" www.raging.com

"http://www.realnames.com" www.realnames.com

"http://www.snap.com" www.snap.com

"http://www.enfin.com" www.enfin.com

"http://www.webtop.com" www.webtop.com

"http://www.dejanews.com" www.dejanews.com

"http://www.iwon.com" www.iwon.com

"http://www.alltheweb.com" www.alltheweb.com

"http://www.askjeeves.com" www.askjeeves.com

"http://www.webcrawler.com" www.webcrawler.com

Bất kỳ công cụ tìm kiếm nào cũng có một hộp text (thường được đặt trên phần đầu trang chính) dùng để bạn gõ nhập các thuật ngữ tìm kiếm. Ngay cạnh đó là một nút chuyển giao có tên là Search (tìm kiếm). Nếu bạn muốn tìm thông tin thì chỉ cần gõ nhập từ khoá vào hộp text và ấn nút Search là yêu cầu của bạn đã được gửi đến công cụ tìm kiếm.

Tuy nhiên, không nên quá vội vã khi sử dụng các công cụ tìm kiếm, mà cần tìm được từ khoá (hoặc thuật ngữ tìm kiếm) để lột tả thông tin cần tìm, từ khoá đó càng chi tiết thì càng có cơ hội tìm đúng thông tin. Có một vài thủ thuật giúp cho phép tìm kiếm của bạn thành công hơn:

+ Càng chuyên biệt càng tốt. Ví dụ, nếu ta đánh cụm từ Thế vận hội, công cụ tìm kiếm sẽ đưa ra tất cả những trang web nói về các thế vận hội từ trước đến nay. Nhưng nếu bạn chỉ quan tâm đến Thế vận hội Synden 2000 thì hãy sử dụng nó như một thuật ngữ tìm kiếm. Điều đó sẽ tạo nên nhiều kết quả chính xác và chi tiết hơn.

+ Sử dụng dấu ngoặc kép (“…”). Trong trường hợp, muốn công cụ tìm kiếm đảm bảo trật tự các từ trong câu thì cần đưa từ khoá hoặc câu khoá đó vào trong dấu ngoặc kép.

+ Sử dụng dấu sao (*). Nếu muốn tìm những cụm từ bất kỳ được bắt đầu bằng một từ nhất định nào đó thì đánh từ đó vào và đằng sau là một dấu sao (dấu sao thay cho bất kỳ từ nào). Ví dụ: Muốn tìm cụm từ bắt đầu bằng Internet, ta nhập vào hộp text: Internet*

+ Ưu tiên sử dụng chữ thường. Muốn tìm một từ, nếu bạn viết chữ hoa, công cụ tìm kiếm sẽ chỉ cho kết quả là những liên kết có chứa từ đó viết hoa. Còn nếu bạn viết thường thì kết quả sẽ là cả những liên kết có chứa từ viết hoa và viết thường.

+ Ưu tiên sử dụng không dấu. Nếu bạn đánh vào hộp text những từ có dấu, công cụ tìm kiếm sẽ cho kết quả là những liên kết chứa từ viết có dấu đó. Còn nếu bạn sử dụng những từ không dấu, thì kết quả sẽ là những liên kết có chứa từ đó viết có dấu và những liên kết có chứa từ đó viết không dấu.

+ Sử dụng toán tử. Đôi khi, để trình bày một phép tìm kiếm, bạn cần phải sử dụng nhiều từ và lúc đó bạn có thể cần sử dụng các toán tử để điều khiển công cụ tìm kiếm. Trong toán học, một toán tử là một từ hoặc một ký hiệu được dùng để chỉ định hoạt động trong phương trình, chẳng hạn như cộng hoặc trừ. Trong thuật ngữ tìm kiếm, các toán tử là các từ mà bạn sử dụng xen kẽ giữa nhiều từ nhằm xác định một cách chính xác các công cụ tìm kiếm sẽ xử lý thuật ngữ của bạn.

Có ba toán tử cơ bản được sử dụng trong phép tìm kiếm:

And: Khi bạn sử dụng and giữa hai từ trong một thuật ngữ tìm kiếm, bạn sẽ có kết quả tìm kiếm là những trang có chứa cả hai từ này (một số công cụ tìm kiếm bạn phải thay toán tử and bằng dấu cộng (+).

Or: Khi bạn sử dụng or giữa hai từ trong một thuật ngữ tìm kiếm, bạn sẽ có kết quả tìm kiếm là những trang có chứa cả hai từ này hoặc một trong hai từ.

Not: Khi bạn sử dụng not giữa hai từ trong một thuật ngữ tìm kiếm, bạn sẽ có kết quả tìm kiếm là những trang có chứa từ phía trước not (Một số công cụ tìm kiếm bạn phải thay toán tử not bằng dấu trừ (-)

Chú ý: Mỗi công cụ tìm kiếm đều có trang hướng dẫn cách tìm kiếm thông tin, vì vậy, trước khi sử dụng công cụ tìm kiếm nào bạn nên dành chút thời gian để xem qua trang này. Ví dụ, trong Google, bạn hãy nháy chuột vào “exact phrase”, sau đó vào mục “searching for an exact phrase”.

Sau khi tìm kiếm toàn bộ cơ sở dữ liệu, công cụ tìm kiếm sẽ hiển thị một danh sách các liên kết bao gồm tất cả các trang mà nó đã xác định là có thông tin như yêu cầu. Danh sách này gọi là hit list (trong đó mỗi liên kết là một hit). Bạn có thể xem qua hit list này để đọc các tiêu đề và phần mô tả trang nhằm xác định trang nào đáp ứng tốt nhất yêu cầu của bạn rồi sau đó nháy chuột để đến trang đó. Nếu trang này không cung cấp những thông tin cần thiết, bạn có thể sử dụng nút Back để trở về hit list và thử vào trang khác, hoặc bắt đầu với một phép tìm kiếm mới.

Thông thường, các công cụ tìm kiếm sẽ điều khiển các hit list này theo cách thông minh nhất, tức là nó sẽ xắp xếp danh sách này theo thứ tự giảm dần. Các trang có thông tin đáp ứng được yêu cầu của bạn nhất sẽ được đặt lên đầu, do đó bạn có thể nhanh chóng nhìn thấy trước tiên. Nếu bạn không tìm thấy gì trong 20 liên kết đầu tiên thì bạn nên khởi động lại với một thuật ngữ tìm kiếm mới.                         

Kết quả bạn tìm được có thể là con số 0 cũng có thể là hàng nghìn. Không có kết quả nào thực sự là một vấn đề, nhưng có hàng nghìn kết quả thì lại là vấn đề khác. Khi người tìm kiếm đã tìm được thông tin cần tìm, lúc đó mới chỉ được một nửa công việc. Một nửa công việc nữa là phải kiểm tra thông tin đó và khẳng định thông tin đó đúng hay sai. Bởi trên mạng Internet không chỉ có những tờ báo mạng điện tử, trang thông tin điện tử của các tổ chức, doanh nghiệp mà còn có hàng triệu triệu các trang web cá nhân với tên gọi weblog hay blog. Theo Tom Curley - Chủ tịch hãng tin AP, một thống kê gần đây cho thấy mỗi ngày có gần bốn triệu trang web cá nhân hoạt động và đưa lên mạng 400.000 tin mới. Con số đó tương đương với mật độ 16.000tin/giờ và bằng tổng số tin mà AP phát trong cả ngày. 

Về bản chất, đây là những nhật ký trực tuyến hay kênh phát ngôn của cá nhân nên rất có thể vì những mục đích khác nhau mà những thông tin họ đưa ra cũng khác nhau. Trên thực tế nhiều weblog, với độ cập nhật thông tin nhanh và khả năng thẩm định, bình luận sâu sắc đã nhanh chóng trở nên nổi tiếng hơn cả nhiều tờ báo điện tử chính thống. ở một chừng mực nào đó, weblog đã khẳng định vai trò cách mạng của nó trong tiến trình phổ cập hoá việc phát hành thông tin.

 Tuy nhiên, chẳng ai dám chắc rằng tất cả các thông tin trên các weblog nói riêng, mạng Internet nói chung đều là sự thật bởi cho đến nay chưa có ai là chủ của Internet. Cũng có những tổ chức tình nguyện quản lý hoạt động của Internet, chẳng hạn như việc bảo đảm mọi máy tính đều có Internet ID duy nhất của chính nó (rất cần thiết cho hoạt động của Internet)… Tuy nhiên, chưa có ai thật sự điều khiển được Internet và làm chủ nó cả.

Chính vì vậy, nửa công việc còn lại của người tìm kiếm thông tin cũng không hề đơn giản và không thể làm qua loa đại khái được. Xin được đưa ra đây một số nguyên tắc để kiểm định sự chính xác của thông tin:

- Kiểm tra thẩm quyền của cá nhân hoặc tổ chức công bố thông tin (Ai là người đưa thông tin lên mạng? Bạn có hài lòng về phần giới thiệu danh tính của họ hay không?).

- Những thông tin đó được xuất phát từ những trang web nổi tiếng đã tạo dựng được thương hiệu uy tín hay từ những trang web mới?... Kiểm tra kỹ mục giới thiệu về cơ quan phụ trách trang web đó.

- Kiểm tra xem có số điện thoại, hòm thư hoặc email hay không để bạn có thể thẩm định ngay độ chính xác của thông tin. Thậm chí, nếu cần bạn phải liên hệ trực tiếp với tác giả của trang web.

- Kiểm tra địa chỉ bởi từ đó chúng ta có thể biết được vài điều có liên quan. Ta có thể xác định được trang web đó là của thành phố, vùng, quốc gia nào hay của cá nhân. Tức là, ta có thể xác định phần nào về nguồn gốc của trang web.

Ví dụ, nhìn vào địa chỉ  "http://www.ajc.edu.vn" http://www.ajc.edu.vn ta có thể biết: http (Hyper Text Transfer Protocol) là giao thức mạng, www là phần định dạng viết tắt của World Wide Web, ajc là tên của trang web, edu là lĩnh vực hoạt động của tổ chức, vn là tên nước.

Một địa chỉ mà tên miền có đuôi .com thì thường là của tổ chức thương mại, doanh nghiệp.

Đuôi .edu: Các tổ chức giáo dục, viện nghiên cứu…

Đuôi .gov: Các tổ chức chính phủ

Đuôi .int: Các tổ chức quốc tế

Đuôi .mil: Các tổ chức quân sự

Đuôi .net: Tài nguyên mạng

Đuôi .ec: Các tổ chức kinh tế

Đuôi .org: Các tổ chức khác

Còn nếu là trang web của cá nhân thì thường có dấu ngã (~) ở trong địa chỉ.

- Kiểm tra thời gian cập nhật của thông tin xem thông tin này mới hay là đã bị lỗi thời.

- Kiểm tra các đường dẫn đã đưa ta đến thông tin đó hoặc chúng sẽ đưa ta tới đâu. Nếu nó liên kết với một trang đáng tin cậy thì đó cũng có thể là yếu tố để đánh giá độ tin cậy của thông tin. Đây chính là cuộc cạnh tranh, tờ báo nào đã có sẵn thương hiệu, có sẵn lòng tin đối với bạn đọc thì sẽ cạnh tranh tốt hơn so với các tờ báo khác về độ tin cậy.

- Tìm đến các chuyên gia trong lĩnh vực này và xin họ các chỉ dẫn hoặc lời khuyên.

- Tham gia và đặt câu hỏi cho các diễn đàn.

- Tìm kiếm thông tin trong nhiều trang web và đối chiếu kết quả tìm được./.