TÀI LIỆU

Internet và các khái niệm cơ bản

Science and Technology

Internet là gì, phân biệt với World Wide Web

Lịch sử ra đời của Internet - Một số mốc đáng chú ý

  • Năm 1969, mạng ARPAnet của bộ Quốc phòng Mỹ được thành lập. (ARPA là viết tắt của từ Advanced Research Projects Agency - Cơ quan các dự án nghiên cứu cao cấp, net tiếng Anh có nghĩa là mạng) với mục tiêu là:
  • Là một mạng máy tính có khả năng chịu đựng các sự cố (ví dụ một số nút mạng bị tấn công và phá huỷ nhưng mạng vẫn tiếp tục hoạt động).
  • Mạng cho phép một máy tính bất kỳ trên mạng liên lạc với mọi máy tính khác.
  • Năm 1982, bộ giao thức TCP/IP được thành lập (TCP/IP=Transmission Control Protocol/ Internet Protocol). Đây là giao thức giúp cho các máy có thể dễ dàng truyền thông với nhau và cũng chính là giao thức chuẩn trên Internet cho đến ngày nay.
  • Năm 1983, ARPAnet sử dụng bộ giao thức TCP/IP và sau đó, Tổ chức Khoa học Quốc gia của Mỹ (National Science Foundation - NSF) tài trợ cho việc xây dựng NSFnet thay thế cho ARPAnet.
  • Năm 1986 NSFnet liên kết 60 đại học Mỹ và 3 đại học châu Âu. Điểm quan trọng của NSFnet là mạng này cho phép mọi người cùng sử dụng.
  • Năm 1991, tại trung tâm nghiên cứu nguyên tử Châu Âu CERN, Tim Berners Lee triển khai thành công dịch vụ World Wide Web (WWW). Chính nhờ dịch vụ này mà người sử dụng tìm thấy ở mạng máy tính toàn cầu có nhiều điều hấp dẫn.
  • Năm 1993 NSF lập InterNIC cung cấp nhiều dịch vụ mới, khái niệm Internet, mạng thông tin toàn cầu được hình thành.
  • Ngày nay Internet thực sự là mạng máy tính của toàn cầu với việc cho phép mỗi người đều tìm thấy ở đó dịch vụ mà mình cần đến.
  • Tháng 12 năm 1997, Việt Nam chính thức tham gia kết nối vào mạng lưới toàn cầu Internet.

Phân biệt World Wide Web (WWW) và Internet

  • WWW là một dịch vụ triển khai trên Internet. Người ta thường nói WWW là dịch vụ trang tin toàn cầu. Như vậy, WWW chỉ là một phần của Internet.
  • Internet bao hàm tất cả thiết bị cấu thành (phần cứng) và các dịch vụ triển khai trên đó (phần mềm) bao gồm dịch vụ trang tin toàn cầu (WWW), dịch vụ truyền tệp tin (File Transfer Protocol - FTP), dịch vụ thư tín điện tử (Email) và dịch vụ nhóm thông tin (Newsgroup).
  • WWW bao gồm các trang thông tin có ký tự, hình ảnh và các hiệu ứng...mà bạn có thể xem bằng các trình duyệt web (Web browser), ví dụ như Microsoft Internet Explorer (IE) hoặc Netscape Navigator.

Các thuật ngữ HTTP, URL, Hyperlink, ISP, FTP

HTTP (HyperText Transfer Protocol)

  • HTTP là viết tắt của HyperText Transfer Protocol, giao thức truyền tệp tin siêu văn bản. Trình duyệt web sử dụng giao thức này để truy xuất và tải về các trang thông tin và các hình ảnh từ máy chủ. Chính vì vậy mà bạn có thể thấy ở ở tiêu đề địa chỉ trang thông tin nào cũng mở đầu bằng http.
  • Ví dụ, bạn có thể sử dụng trình duyệt web truy xuất vào trang thông tin của Đại học Quốc gia Hà Nội bằng cách gõ vào ô địa chỉ http://www.vnu.edu.vn.

URL (Uniform Resource Locator)

  • URL (Uniform Resource Locator), bộ định vị tài nguyên thống nhất. Cấu trúc của URL bao gồm: Tên của giao thức (thường là HTTP hoặc FTP), sau đó là địa chỉ mà bạn muốn kết nối đến, rồi đến vị trí của tài nguyên cần truy xuất.

Siêu liên kết (Hyperlink)

  • Hyperlink, siêu liên kết, là một phần văn bản (hay hình ảnh) của trang Web, mà khi bạn nhấn chuột vào đó sẽ tự động thực hiện một trong các thao tác sau đây:
    • Đưa bạn đến phần khác của trang;
    • Đưa bạn đến một trang web khác trong cùng một website;
    • Đưa bạn đến một trang web khác trong website khác;
    • Cho phép bạn tải về (download) một tệp tin;
    • Chạy một ứng dụng, trình diễn một đoạn video hoặc âm thanh.
  • Để nhận ra đâu là siêu liên kết, đâu là các dòng văn bản có màu hoặc có gạch chân, bạn nên đưa chuột đến khu vực đó. Thông thường, con trỏ chuột sẽ biến thành hình bàn tay (hình minh hoạ) hoặc ở thanh trạng thái (status bar) phía dưới sẽ hiện ra đích đến (target) nếu như bạn đang trỏ chuột đúng vào siêu liên kết.
Biểu tượng của con trỏ tại vị trí siêu liên kết
  • Hình ảnh minh hoạ dưới đây là một phần của trang web của Trung tâm Đào tạo và sát hạch, Viện Công nghệ Thông tin, ĐHQG Hà Nội. Những dòng chữ có gạch dưới chính là các siêu liên kết. Theo mặc định thì các ký tự trong siêu liên kết đó có màu xanh dương.
Siêu liên kết và địa chỉ tương ứng

ISP (Internet Service Provider)

  • ISP, nhà cung cấp dịch vụ Internet, là nơi bạn đăng ký thuê bao hoặc đăng ký sử dụng nếu muốn có quyền truy xuất dịch vụ Internet. ISP sẽ giúp bạn kết nối với Internet thông qua đường dây điện thoại hoặc đường dây thuê bao số tốc độ cao. Ở Việt Nam, danh sách các ISP có thể kể đến như VDC, FPT, Vietel, Netnam...

FTP (File Transfer Protocol)

  • FTP, giao thức truyền tệp tin, là cách thức để truyền dữ liệu từ nơi này đến nơi khác qua mạng Internet. Giao thức này thường được sử dụng để tải về hoặc đưa lên Internet các tệp tin có dung lượng lớn.
  • Bạn có thể không cần quan tâm cách thực hiện của FTP mà trong hầu hết các trường hợp, chỉ cần nhấn chuột vào một liên kết cho phép tải về tệp tin trong trang web thì trình duyệt sẽ thực hiện các thao tác truyền FTP cho bạn. Điều bạn cần quan tâm là cần phải tải về tệp tin có tên là gì hoặc mình sẽ đặt tên mới cho tệp tin là gì và sẽ lưu trữ nó ở đâu trong máy của mình.
  • Các chương trình FTP thông dụng giúp bạn có thể nhập vào địa chỉ của máy chủ cần truy xuất tới, tên và mật khẩu đăng nhập (nếu có) và các giao diện để bạn có thể dễ dàng tải về hoặc đưa lên các tệp tin của mình, ví dụ chương trình Total Commander, WSFTP, CuteFTP...

Các thành phần và cấu trúc một địa chỉ trang Web.

Các Website và URL

  • Website, khu vực chứa web, là nơi các trang web được lưu trên một máy chủ WWW và có thể được truy cập từ Internet.
  • Trong số các trang web thuộc website này, có một trang Homepage (trang chủ) là trang sẽ được máy chủ gọi ra đầu tiên khi người dùng truy cập vào vùng này. Từ trang chủ, người dùng sẽ đi theo các siêu liên kết để đi tới các trang web khác trong web site.
  • Mỗi website có một địa chỉ, bạn cần phải biết được địa chỉ này để có thể truy xuất tới được website đó.
  • Địa chỉ của một website được cho dưới dạng URL, ví dụ địa chỉ website của trang tin vnexpress là http://www.vnexpress.net/Vietnam/Home/

Khái niệm trình duyệt web (web browser)

Trình duyệt web là gì?

  • Trình duyệt web là phần mềm giúp bạn có thể xem được thông tin từ các website trên Internet. Có rất nhiều trình duyệt web khác nhau, ví dụ như trình duyệt web Internet Explorer (IE), Netscape Navigator/Communicator (Netscape), Opera, MyIE2, Mozilla FireBird, Avant... trong đó phổ biến hơn cả là phần mềm trình duyệt IE
  • Mỗi phần mềm trình duyệt đều có các phiên bản khác nhau, phiên bản mới nhất là phiên bản có nhiều tính năng hơn các phiên bản trước đó. Tuy nhiên, các chức năng sử dụng cơ bản của trình duyệt như lùi (back), tiến (forward), làm tươi (refresh)... đều giống nhau và người dùng chỉ cần biết sử dụng một loại trình duyệt là có thể rất dễ dàng học cách sử dụng các trình duyệt khác để có thể truy xuất và xem các thông tin trên Internet.

Các trình duyệt web thông dụng: IE
Opera
...và Netscape

Máy tìm kiếm (Search Engine) và các công dụng

Máy tìm kiếm tìm kiếm là gì?

  • Máy tìm kiếm là một hệ thống cho phép tìm kiếm các thông tin trên Internet theo yêu cầu của người dùng. Người dùng muốn tìm thông tin trên Internet chỉ cần truy xuất vào địa chỉ của máy tìm kiếm, gõ từ khóa hoặc nội dung cần tìm và đợi máy tìm kiếm trả về kết quả. Thông thường, màn hình làm việc mặc định của máy tìm kiếm chính là trang chủ của website chứa máy tìm kiếm đó.
  • Máy tìm kiếm có các chức năng lưu trữ thông tin về các website trên Internet. Nó chỉ bao gồm thông tin về các website được người dùng dẫn hướng cụ thể, hoặc các website mà nó tự tìm thấy. Chính vì vậy mà các máy tìm kiếm này không bao gồm thông tin của tất cả các website trên mạng. Có nhiều máy tìm kiếm của nhiều hãng khác nhau và kết quả trả về là khác nhau kể cả khi người dùng sử dụng cùng một từ khóa.
  • Ở Việt Nam, các máy tìm kiếm sau đây có thể hỗ trợ tìm kiếm trên nhiều loại tài liệu tiếng Việt khác nhau: http://www.panvietnam.comhttp://www.vinaseek.com .
  • Hình minh họa là trang chủ của website tìm kiếm google. Bạn chỉ cần mở trình duyệt web, gõ vào ô địa chỉ http://www.google.com rồi nhập vào từ khóa hoặc thông tin cần tìm trong ô tìm kiếm (Ví dụ từ khóa “ADSL là” để tìm định nghĩa về ADSL, chú ý dấu ngoặc kép để chỉ đó là một cụm từ gần nhau) rồi nhấn chuột vào nút Google Search.
Trang chủ của máy tìm kiếm google, đang tìm với từ khoá “đề án 112”
  • Sau khi nhấn chuột vào nút Tìm kiếm với google trang dưới đây sẽ hiện ra:

Kết quả tìm được

  • Kết quả trả về là danh sách các website có chứa cụm từ bạn đang cần tìm. Mỗi kết quả bao gồm tiêu đề trang web có chứa cụm từ đó, nội dung tóm tắt của đoạn có chứa cụm từ đó trong website và địa chỉ liên kết tới trang có chứa từ đó. Đây là các thông tin cho phép bạn có thể đánh giá và sau đó quyết định nên đến trang này hay trang kia. Nhấn chuột vào tiêu đề các trang kết quả, bạn sẽ đến được với trang web mình cần.

Cookie là gì? Internet cache (bộ nhớ đệm) là gì?

Cookie là gì?

  • Cookie là các thông tin lưu trong máy của bạn do các website bạn đã từng truy nhập ghi vào. Các thông tin này được lưu trong các file văn bản nhỏ, bao gồm các thông tin về quá trình truy xuất web của bạn hoặc các thông tin cá nhân mà bạn đã từng khai báo với trang web đó.
  • Ưu điểm của cookie là sau khi bạn đã đăng nhập vào một hệ thống nào đó, lần sau bạn sẽ không phải đăng nhập lại nữa, nếu bạn cho phép website đó sử dụng cookie để lưu trữ các thông tin này. Ngoài ra, một số trang web cho phép đưa bạn đến ngay trang mà bạn đang truy nhập dở dang từ lần trước nhờ đọc các thông tin trong cookie trong máy của bạn. Như vậy, cookie giúp bạn có thể truy xuất nhanh hơn, tiện dụng hơn, đúng theo các sở thích cá nhân hơn.
  • Nhược điểm của cookie là dễ bị lợi dụng. Người khác sử dụng máy của bạn hoàn toàn có thể đăng nhập hệ thống như vai trò của bạn. Chưa kể, các virút hoặc các chương trình lấy trộm thông tin sẽ dựa vào cookie để kiểm soát xem bạn đã từng đi đâu, làm gì và có những thông tin gì...
Các tệp tin cookie trong máy tính

Internet cache là gì?

  • Thông tin từ Internet về tới máy tính sẽ được lưu trữ tại một vùng trong ổ cứng máy tính của bạn, sau đó mới hiển thị ra màn hình. Vùng lưu trữ này gọi là vùng nhớ đệm thông tin trên Internet (Internet Cache). Do vậy, nếu đã từng mở một trang web nào đó ra rồi thì khi bạn quay lại website đó thì các thông tin sẽ được tải ngay từ vùng nhớ đệm này và chỉ cập nhật những phần thay đổi.
  • Ưu điểm của vùng nhớ đệm là tốc độ truy xuất rất nhanh (nếu bạn đã từng vào một trang, nhất là trang có nhiều ảnh và sau này có nhu cầu truy xuất lại) do không phải tải toàn bộ thông tin từ Internet. Vùng nhớ đệm còn giúp bạn có thể xem lại các thông tin mà bạn đã từng truy xuất nhờ kết hợp với các chức năng history (lịch sử) và work offline (làm việc không trực tuyến) sẽ nói ở phần sau.
  • Nhược điểm của vùng nhớ đệm là đôi khi khiến người dùng phải xem các thông tin đã cũ nếu không để ý các thông số ngày tháng. Để tránh điều này, bạn cần thỉnh thoảng sử dụng chức năng làm tươi (refresh, sẽ nói ở phần sau) để có thể luôn luôn lấy được những thông tin mới nhất từ phía máy chủ.
  • Ngoài ra, vùng nhớ đệm cũng là nơi trú chân của virút khi bắt đầu lây lan vào máy tính của bạn thông qua con đường Internet. Như vậy, bạn cần chú ý và quản lý vùng nhớ đệm thật tốt.
Các tệp tin trong vùng nhớ đệm Internet Cache