2010/09/12

Vượt tường lửa | Kỹ Thuật Sàng Lọc Thông Tin

Lọc Internet là bộ kỹ thuật các nhà kiểm duyệt sử dụng để cố gắng ngăn chặn người dùng Internet truy cập nội dung hoặc dịch vụ. Những nhà điều hành mạng có thể sàng lọc thông tin tại bất kỳ điểm nào trong mạng, sử dụng nhiều kỹ thuật, với mức độ chính xác và thích nghi khác nhau. Thông thường, cách sàng lọc liên quan đến việc sử dụng các phần mềm để theo dõi hành vi của người dùng và tùy theo đó mà can thiệp vào các hoạt động được xem là bị cấm bởi chính sách của nhà nước. Một bộ lọc có thể được tạo ra và áp dụng bởi một chính phủ hoặc bởi các nhà cung cấp truy cập Internet ở cấp quốc gia hay địa phương.
Có bốn loại sàng lọc thông tin phổ thông áp dụng cho Internet mà bạn cần biết đến.

Lọc Bằng Đường Dẫn URL

Một cách mà các quốc gia hay các thực thể dùng để chặn việc truy cập thông tin trên web là ngăn chặn truy cập dựa trên đường dẫn URL (địa chỉ của một trang web) - hoặc toàn bộ hay một phần của đường dẫn đó.
Giới kiểm duyệt Internet thường muốn chặn hoàn toàn các trang web nào mà họ không thích nội dung trong đó. Họ có thể chặn tên miền dựa vào tên hoặc dựa vào mã số IP.

Đôi khi, nhà cầm quyền có chọn lọc hơn, chỉ chặn các miền phụ trong một miền nhất định, cùng lúc lại chừa lối vào cho những phần còn lại của tên miền đó. Ví dụ, họ có thể chỉ lọc miền phụ news.bbc.co.uk, trong khi đó thì chừa, không sàn lọc, các tên miền chính là bbc.co.uk và www.bbc.co.uk. Tương tự như vậy, họ có thể lọc bỏ các nội dung cá biệt, ngay khi họ cho phép truy cập phần còn lại của miền đang lưu trữ những trang đó. Một cách để tìm tên thư mục, chẳng hạn như "worldservice" để chặn các tin tức BBC tiếng nước ngoài tại bbc.co.uk/worldservice, mà không ảnh hưởng đến trang web tiếng Anh của bbc.co.uk. Họ thậm chí có thể chặn một số trang nào đó mà họ không thích dựa trên tên của trang, hoặc dựa trên từ khoá được tìm kiếm.

Lọc bằng Hệ Thống Tên Miền (DNS)

Khi sử dụng Internet để thông tin nhất là khi truy cập trang mạng, tên miền như "tenmien.com" thường được dùng hơn là địa chỉ dạng số IP. Tuy nhiên, khi các máy tính liên lạc với nhau qua Internet, cần có địa chỉ dạng số để biết đường đi. Khi bạn ghi địa chỉ của trang web (tên miền) vào trình duyệt, việc đầu tiên trình duyệt làm là hỏi máy chủ DNS để tìm tên miền và cung cấp địa chỉ số IP tương ứng. 
PDFpg022pic1_1_1.jpg
 
Nếu máy chủ DNS được thiết lập để chặn truy cập, máy sẽ tra cứu "sổ đen" có các tên miền bị cấm. Khi trình duyệt yêu cầu địa chỉ IP của một trong những tên miền bị cấm, máy chủ DNS cho câu trả lời sai hoặc hoàn toàn không hồi âm.
 
PDFpg023pic1_1.jpg

Nếu không có địa chỉ IP, máy tính không thể tiếp tục được và thông báo cho biết có lỗi. Vì trình duyệt không tìm được địa chỉ IP của trang web nên không thể liên lạc với các trang web để yêu cầu cung cấp thông tin. Kết quả là tất cả các trang thuộc tên miền nầy đã bị chặn.

Những cách để vượt qua việc sàng lọc DNS:

* Truy cập vào nội dung bạn muốn từ trang Web khác với tên miền khác.

* Tìm địa chỉ IP qua một hệ thống tên miền khác. Chẳng hạn như dùng một máy chủ cung cấp dịch vụ DNS miễn phí hoặc bạn tự thiết kế lấy dịch vụ DNS của riêng mình. Tìm địa chỉ IP được đăng tải ở nơi khác.

* Truy cập thông tin xuyên qua một trang web khác không bị chặn, thí dụ như qua web proxy hoặc trang đệm (cached) của các dịch vụ tìm kiếm thông tin trên mạng (như Google).

Lọc bằng địa chỉ IP

Các dữ liệu gửi qua Internet được chia thành nhiều đoạn và chứa trong một đơn vị gọi là gói dữ liệu (packet). Một gói dữ liệu chứa cả dữ liệu được gửi đi và thông tin về cách để gửi, chẳng hạn như các địa chỉ IP của máy gửi và máy nhận. Những thiết bị định tuyến (router) là các máy tính mà những gói dữ liệu kia phải đi qua trên đường từ người gửi đến nơi nhận, nhằm xác định hướng đi để đi tiếp. Nếu nhà kiểm duyệt muốn ngăn chặn người dùng truy cập vào các máy chủ nào đó, thì các router dưới quyền kiểm soát của họ sẽ được thiết lập để "vất bỏ” (thay vì truyền tải) dữ liệu nào gửi đến các địa chỉ IP trong sổ đen, hoặc hồi báo rằng bị lỗi. Cách lọc chỉ dựa vào địa chỉ IP sẽ chặn tất cả dịch vụ được cung cấp bởi máy chủ, chẳng hạn trang web và email của máy chủ sẽ bị chặn. Vì chỉ có địa chỉ IP được kiểm tra nên nhiều tên miền dùng chung một địa chỉ IP cũng bị ảnh hưởng lây, mặc dầu chỉ có một tên miền trong số này bị cấm.

Để vượt qua việc bị sàng lọc và kiểm duyệt bằng IP, bạn có thể truy cập nội dung cần tìm ở nơi khác, hoặc chuyển tải  yêu cầu qua những trang web không bị chặn.

Chặn bằng Cổng (Port)

Cổng (port) giống như những cánh cửa có số riêng biệt trong một tòa nhà, mỗi ngõ dẫn đến phòng hoặc dãy buồng khác nhau. Trong máy vi tính, cổng cũng được cho số: những cổng tiêu chuẩn khá thông dụng có số từ 0 đến 1024, còn các cổng khác có thể lên đến 65535. Mỗi cổng chuyên trách một công việc nào đó cho máy vi tính hay máy chủ (như truy cập web hay email). Khi máy tính yêu cầu truy cập một dịch vụ nào đó từ máy tính khác, nó cho biết rõ cổng số mấy. Máy tính cung cấp dịch vụ thì “lắng nghe” các lời yêu cầu ở các cổng này.

Khi những người muốn kiểm duyệt liệt kê các số cổng vào sổ đen họ sẽ hạn chế quyền truy cập từng dịch vụ từ máy chủ, chẳng hạn như truy cập trang web hoặc email. Các ứng dụng thông thường trên Internet đều có các số cổng đặc trưng. Các mối quan hệ giữa dịch vụ và số cổng được ấn định bởi cơ quan IANA, nhưng không bắt buộc như thế. Việc ấn định cho phép bộ định tuyến (router) phỏng đoán dịch vụ đang được truy cập. Vì vậy, để chặn duy nhất lưu lượng truy cập web, nhà kiểm duyệt chỉ cần chặn cổng 80, vì đó là cổng thường được sử dụng để truy cập web.

Phương pháp trực tiếp nhất để vượt qua việc chặn cổng là sử dụng các cổng mang số không theo quy ước chung để truy cập các dịch vụ đã định. Người sử dụng phải có chút đỉnh kiến thức về hệ thống để tận dụng lợi thế của phương pháp này, ngõ hầu sắp xếp các phần mềm trình duyệt web hoặc hướng dẫn khách hàng dùng email sử dụng các cổng không theo quy ước. Các phương pháp khác để tìm nội dung bao gồm truy cập dịch vụ giống nhau hoặc tương tự từ những máy chủ hợp tác, hoặc truy cập máy chủ bị chặn qua địa điểm không bị cản.

Tại Sao Điều Này Quan Trọng

Những kỹ thuật kiểm duyệt này phụ thuộc vào sự vận hành nhiều cơ phận khác nhau của hạ tầng cơ sở Internet mô tả ở trên. Bạn nên có một số kiến thức về kỹ thuật sàng lọc nào đang được áp dụng trong trường hợp của bạn. Nếu bạn muốn tạo máy chủ không bị ngăn chặn ở bên ngoài của vị trí đang thi hành việc ngăn chặn, bạn sẽ phải cần thêm chi tiết kỹ thuật để làm được việc này.



Tác giả: Kỹ Thuật Sàng Lọc
© Edward Cherlin 2008
Điều chỉnh:
Adam Hyde 2008
Alice Miller 2008
Janet Swisher 2008
Niels Elgaard Larsen 2009
Sam Tennyson 2008
Seth Schoen 2008
Tom Boyle 2008
Tomas Krag 2008




Giấy phép: Giấy phép Công cộng
Sản xuất cho cẩm nang FLOSS.

No comments:

Post a Comment