Thiết kế và thi hành DFS

Trong đoạn này, đầu tiên đề cập một số khái niệm cơ bản về file và hệ thống file. Vấn đề duy nhất trong thiết kế và thi hành DFS là dựa theo nhu cầu chia xẻ và nhân bản file. Trọng tâm chính của chương là các giao thức đạt được tính trong suốt trong chia xẻ và nhân bản file.

File và hệ thống file

Với người dùng, file gồm 3 thành phần logic

Tên file Thuộc tính file Dữ liệu

File được tạo ra gắn với tên tượng trưng (tên). Khi truy cập file, tên file được ánh xạ tới số hiệu file duy nhất (ufid hoặc thẻ file), cho phép định vị được file vật lý. Đây là chức năng nguyên thủy của dịch vụ thư mục trong hệ thống file. Các thuộc tính file điển hình là thông tin về chủ nhân, kiểu, kích thước, tem thời gian và quyền truy nhập file.

Các đơn vị dữ liệu trong file được tổ chức theo cấu trúc phẳng dòng byte hoặc dãy tuần tự các khối, hoặc theo một lựa chọn khác, là cấu trúc phân cấp các bản ghi có chỉ số. Phụ thuộc vào cấu trúc file hạ tầng mà file được truy cập theo một trong ba cách:

(1) Truy nhập tuần tự: Trong truy nhập tuần tự, với mỗi file đã mở, hệ thống duy trì một con trỏ định vị file nhằm chỉ dẫn vị trí của đơn vị dữ liệu tiếp theo sẽ được truy cập. Con trỏ file không phải một phần của thuộc tính file; thực chất nó là phần của trạng thái QT (dù cho con trở file được chia xẻ giữa các QT liên quan). Mở file khởi tạo con trỏ file và bắt đầu phiên làm việc, truy nhập file tiếp theo được diễn ra cho đến khi file được đóng. Phiên làm việc tương tự kết nối trong truyền thông mạng định hướng kết nối.

(2) Truy nhập trực tiếp: Khác với truy cập tuần tự (vị trí đơn vị dữ liệu đọc/ghi đã xác định), trong truy nhập trực tiếp cần chỉ dẫn rõ ràng đơn vị dữ liệu kích thước-cố định bằng số hiệu khối của chúng. Mỗi thao tác đọc/ghi chứa thông tin địa chỉ đầy đủ và độc lập với thao tác đọc/ghi khác. Truy nhập file giống như truyền thông mạng không kết nối. Mở file là không nghiêm ngặt ngoại trừ phiên (xem trong 6.2.5) cần có ngữ nghĩa mong muốn để chia xẻ file. Bổ sung tới định nghĩa phiên, hầu hết các hệ thống file dùng lời gọi hệ thống open để thực hiện ánh xạ một lần tên file tới trình bày máy nội tại cho truy nhập file về sau và thu được quyền truy nhập file. Đối với phương pháp truy nhập trực tiếp, thao tác open có chức năng giống định vị file look-up hơn.

(3) Truy nhập tuần tự số hiệu (chỉ số kế tiếp): Các đơn vị dữ liệu được địa chỉ trực tiếp bằng số hiệu (khoá) gắn với mỗi khối dữ liệu. Truy nhập tuần tự số hiệu đòi hỏi duy trì chỉ số tìm kiếm trong file, cần tìm được định vị khối cho mỗi truy nhập. Tuỳ thuộc vào dung lượng và tổng phí thời gian, truy nhập chỉ số thường được dùng đối với hệ thống file lớn trong hệ thống máy tính lớn. Để giảm kích thước số hiệu tìm kiếm, thông thường dùng sơ đồ hai mức, là phương pháp truy nhập chỉ số kế tiếp. Một dãy cặp khóa/đối tượng được bảo quản trong khối dữ liệu lớn. Cặp khóa/đối tượng được định vị khi dùng số hiệu tìm kiếm để định vị khối chứa cặp này, sau đó truy nhập dữ liệu trên khối cho đến khi tìm thấy cặp khóa/đối tượng. Thao tác hai mức này tổ hợp các phương pháp truy nhập trực tiếp và tuần tự tương tự như tìm thông tin theo số hiệu trong một quyển sách. Cách thức này được dùng đối với file dữ liệu lớn, trong đó các bản ghi của file được giữ trong bộ nhớ phụ còn bảng số hiệu được duy trì trong bộ nhớ nguyên thủy để tìm kiếm hiệu quả.

Cấu trúc file dãy có lợi ích và thông dụng hơn do tính đơn giản và tương đồng với các thiết bị lưu giữ thi hành file. Ví dụ, Unix coi rằng file là dòng kí tự của chương trình ứng dụng và dãy các khối kích thước cố định trong hệ thống file. Cả hai phương pháp truy nhập tuần tự và trực tiếp được hỗ trợ. Các phương pháp truy nhập khác được xây dựng dựa trên nền cầu trúc file dãy.

Dịch vụ thư mục Giải pháp tên, thêm và xoá file
Dịch vụ xác thực năng lực và/hoặc danh sách điều khiển truy nhập
Dịch vụ file
giao dịch Quản lý đồng thời và nhân bản
cơ sở đọc/ghi file và nhận/đặt thuộc tính
Dịch vụ hệ thống Quản lí thiết bị, cache, khối

Hình 6.1 Thành phần chính trong hệ thống file

Hệ thống file tổ chức và cung cấp dịch vụ truy nhập và bảo vệ cho tập hợp file. Bốn thành phần dịch vụ chức năng chính: thư mục, xác thực, file và hệ thống. Hệ thống file hỗ trợ giao dịch lại phân chia dịch vụ file thành dịch vụ giao dịch và dịch vụ file cơ sở. Dịch vụ giao dịch có bài toán thi hành riêng (xem 6.3.3). Hình 6.1 cho ví dụ về chức năng được mỗi dịch vụ cung cấp. Tổ chức file dữ liệu trong hệ thống file có thể là dãy hoặc phân cấp, tương tự như lựa chọn cấu trúc nội tại của mỗi file riêng. Tuy nhiên, tự nhiên hơn khi tổ chức file theo nhiều mức, nhận được kết quả là thư mục phân cấp và cấu trúc tên. File được đặt tên và truy nhập theo tên đường dẫn phân cấp chẳng hạn /chow/lecture/file, như hình 6.2.

Để truy nhập file, đầu tiên dùng dịch vụ thư mục để định vị file. Dịch vụ thư mục ánh xạ tên phân cấp tới địa chỉ là hoàn toàn độc lập với thao tác file thực sự. Do đó tách dịch vụ thư mục từ dịch vụ file nhằm đạt được tính đơn thể và khả chuyển. Ưu điểm chính của việc tách các dịch vụ là cho phép một dịch vụ file chung hỗ trợ được nhiều kiểu cấu trúc thư mục khác nhau. Thư mục là "file" chứa tên và địa chỉ của các file và thư mục con. Thao tác file thư mục là tra cứu, thêm, xóa các thực thể thư mục (điểm vào) trỏ tới các file. Phục vụ thư mục là khách của dịch vụ file để cập nhật file.

Cập nhật file phải an toàn - đó là vai trò của dịch vụ xác thực. Vị trí logic của dịch vụ xác thực cần ở giữa dịch vụ thư mục và dịch vụ file để bảo vệ file hay ở trước dịch vụ thư mục để bảo vệ thư mục. Trong thi hành thực sự (1) Dịch vụ xác thực được trộn với dịch vụ file: dịch vụ file duy trì thông tin điều khiển truy nhập. Dịch vụ thư mục đơn thuần thực hiện giải pháp tên và cung cấp thẻ file để định vị file được đòi hỏi trong một phục vụ file. Thao tác file được kiểm tra để xác thực khách đưa ra thao tác đó; (2) Dịch vụ xác thực được trộn với dịch vụ thư mục: Dịch vụ thư mục được bổ sung giải pháp tên để thực hiện việc kiểm tra điều khiển truy nhập. Dịch vụ thư mục duy trì thông tin điều khiển truy nhập file (và thư mục). Nếu xác thực khách để mở file đã được kiểm tra, khách nhận được một thẻ file và thẻ đặc quyền không làm giả để sử dụng file của khách. Đối với các truy nhập tiếp theo của dịch vụ file thì chỉ có thẻ đặc quyền là có giá trị đối với phục vụ file. Định danh khách là không thích hợp tới phục vụ file, do thẻ đặc quyền đã xác thực khách. Quy tắc xác thực truy nhập được thảo luận chi tiết trong phần an toàn hệ điều hành.

Dịch vụ file cần cung cấp các thao tác file cơ bản là read/write khối dữ liệu và get/set thuộc tính file. Do file cần được khởi tạo trước khi được dùng và cần được xoá khi không cần thiết, dịch vụ file cũng cần hỗ trợ thao tác tạo và xóa file. Tạo/xóa file bao gồm cả việc bổ sung và xóa bỏ thực thể trong thư mục nhờ dịch vụ thư mục. Chúng liên quan với dịch vụ hệ thống bên dưới là định vị và gỡ bỏ (giải định vị) bufer và file. Dịch vụ file trở thành khách của dịch vụ thư mục và dịch vụ hệ thống.

Thao tác mở file là một thao tác đáng quan tâm trong dịch vụ file. Thao tác mở file bao gồm khởi tạo phiên làm việc các thao tác file lên một file. Nó tương tự việc thiết lập kết nối khách tới phục vụ file. Dịch vụ thư mục được thao tác mở file tra cứu chỉ một lần duy nhất. Thẻ file nhận được khi tra cứu dịch vụ thư mục và giữ tại nhân của khách. Các thao tác read/write tiếp theo được gửi tới dịch vụ file trực tiếp khi dùng thẻ file. Nhân lưu đường đi của kết nối, bao gồm cả con trỏ định vị file cho thao tác read/write tiếp theo. Nhiều hệ thống file còn ngầm định rằng thao tác mở file sẽ khởi tạo file mới nếu nó chưa tồn tại. Thao tác đóng file kết thúc một phiên mở. Thao tác mở file là không thực sự cần thiết nếu quan hệ khách và phục vụ là không kết nối. Trong trường hợp như thế, read và write là các thao tác thực hiện ("ăn") ngay. Mỗi yêu cầu từ khách tới phục vụ file chứa thông tin cần thiết để truy nhập file.

Các dịch vụ thư mục, xác thực và file là giao diện người dùng tới hệ thống file. Dịch vụ hệ thống là giao diện hệ thống file tới phần cứng và cần trong suốt tới người dùng. Dịch vụ hệ thống cung cấp các chức năng chính yếu gồm ánh xạ địa chỉ lôgic tới địa chỉ khối vật lý, tương tác tới các dịch vụ mức thiết bị đề định vị/giải phóng không gian file và thao tác file read/write thực sự. Dịch vụ hệ thống được hỗ trợ nhờ lời gọi hệ thống tới nhân. Cuối cùng, file trong hệ thống file có thể được cache nhằm nâng cao hiệu năng và được nhân bản để tăng tính tin cậy. Điều quan trọng là quản lý cache và nhân bản trở thành các dịch vụ hệ thống bản chất khác của hệ thống file. Cache và nhân bản là phức tạp hơn khi chia xẻ file trong hệ phân tán. Hai vấn đề quan trọng này trong thiết kế hệ phân tán được bàn luận trong phần sau.

Phục vụ và dịch vụ

Cần phân biệt dịch vụ với phục vụ. Phục vụ là quá trình thi hành dịch vụ. Một dịch vụ được thực hiện bởi phục vụ riêng hay nhiều phục vụ cộng tác nhau. Thông thường, hệ thống file lớn phân bố các file được quản lý tới các phục vụ file. Một phục vụ cũng cung cấp dịch vụ đa thành phần, chẳng hạn như phục vụ thư mục thực hiện cả dịch vụ thư mục và dịch vụ xác thực.

Mối quan hệ Client/Server chỉ là tương đối. Để truy cập file, QT người dùng trước hết là QT khách với phục vụ thư mục. Phục vụ thư mục yêu cầu dịch vụ file và trở thành khách của phục vụ file. Việc xác thực truy nhập làm cho phục vụ file hoặc phục vụ thư mục trở thành khách tới phục vụ xác thực. Phục vụ xác thực có thể đòi hỏi dịch vụ của phục vụ file. Dịch vụ file dựa vào dịch vụ hệ thống tới các chức năng mức thấp do nhân cung cấp. Hình 6.3. cho ví dụ tích hợp giữa bốn dịch vụ này trong hệ thống file. Đường nối trong hình vẽ chỉ dịch vụ xác thực có thể trộn hoặc với phục vụ thư mục hoặc phục vụ file.

Thông thường, phục vụ phù hợp với máy tính cung cấp tài nguyên mà phục vụ quản lý. Phần lớn các hệ thống file tập trung lớn sử dụng các máy dành riêng như phục vụ file vì lý do hiệu năng và quản lý. Trong hệ thống như vậy, có sự phân biệt mang tính đặc trưng giữa máy phục vụ với máy khách. Tuy nhiên, trong môi trường phân tán các file là rải rác giữa một số máy tính, để hiệu quả hơn về giá thành thì mỗi máy tính đảm nhận cả hai vai trò khách và phục vụ.

Kiên định mô hình Client/Server và phân chia trách nhiệm trong hệ phân tán. các phục vụ trong DFS thường được cấu trúc nhằm cung cấp các dịch vụ thư mục, xác thực, file và hệ thống một cách riêng rẽ.

Gắn kết file và đăng kí phục vụ

Giả sử thư mục được cấu trúc phân cấp. "Gắn kết file" là khái niệm hữu dụng để xây dựng hệ thống file lớn từ các phục vụ file và thiết bị lưu giữ khác nhau. Thao tác gắn file do một khách thực hiện việc gắn một hệ thống file có tên từ xa tới hệ thống file khách phân cấp tại một điểm được định vị bằng một tên đường dẫn. Điểm gắn kết thường là lá của cây thư mục chứa tương ứng một thư mục con rỗng. Hệ thống file có tên được gắn kết được định danh bằng một máy tính từ xa hoặc một thiết bị cục bộ tiếp theo là tên đường dẫn tới hệ thống file. Hình 6.4. cho thấy hệ thống file được tạo thành nhờ gắn hệ thống file cục bộ với hệ thống file từ xa. Trong hình, hệ thống file từ xa "xuất khẩu" hệ thống file con OS chứa ba file DFS, DSM và Security. Hệ thống file con này được gắn kết tới thư mục con của khách, book, khi dùng giao thức gắn kết.

Mỗi lần file đã được gắn, chúng được truy nhập theo tên đường dẫn lôgic nối tiếp nhau không cần chỉ dẫn máy từ xa hay thiết bị cục bộ. Tính trong suốt định vị của các file được thi hành. Thông tin liên kết (thường được gọi là bảng gắn kết để định hướng lại truy nhập) đối với hệ thống file từ xa được hệ thống file của máy tính duy trì cho đến khi tháo gắn kết. Dùng cơ chế gắn kết như vậy, các khách khác nhau có thể nhìn theo khung nhìn hệ thống file khác nhau do các file từ xa có thể được gắn trên các thư mục con khác nhau của mỗi khách. Khi mong muốn có được khung nhìn hệ thống file toàn cục đồng nhất, quản trị hệ thống file tuân theo các luật gắn kết. Ví dụ, các file hệ thống chia xẻ bắt buộc gắn tới vị trí đã thoả thuận nào đó trong cấu trúc thư mục tách rời với hệ thống file cục bộ. Vì lý do an ninh, một phục vụ file thường chính xác gắn toàn bộ hoặc một phần hệ thống file của nó tới tập các máy đã được xác định trước. Thông tin này được chứa trong file export của phục vụ.

Gắn kết hệ thống file là thao tác đặc quyền và được thi hành theo ba thể hiện khác nhau:

(1) Gắn hiển: Khách đưa ra lời gọi gắn kết rõ ràng mỗi khi cần,

(2) Gắn khởi động: Một tập phục vụ file được quy định và tất cả các gắn kết được thực hiện tại thời điểm khởi động máy khách,

(3) Gắn tự động: Gắn các phục vụ được thực hiện tự động hoàn toàn theo yêu cầu trong lần đầu tiên file được khách mở.

Gắn hiển hệ thống file có tính linh hoạt (cho khách) nhưng tính quản lý kém hơn so với gắn khởi động, trong đó cấu hình đồng nhất của hệ thống file có hiệu lực tại thời điểm khởi động. Khi dùng gắn khởi động, khách có khung nhìn hệ thống file tĩnh song đầy đủ trong toàn bộ phiên tính toán. Lẽ tự nhiên, gắn khởi động lại có nhược điểm về phí tổn khi gắn các phục vụ không cần thiết. Gắn tự động kết hợp gắn hiển và gắn khởi động và có các ưu điểm của cả hai. Nó là động, giống như gắn hiển (chính xác hơn là file được gắn chỉ khi nó được truy nhập), và trong suốt, giống như gắn khởi động khi bỏ qua lời gọi gắn hiển. Khi một file được mở, nhân chọn một phục vụ từ tập phục vụ đã quy định sẵn và gắn hệ thống file được yêu cầu. Gắn tự động trong hệ thống file mạng (NFS) của Sun tiến hành thêm một bước nữa. Nó cho phép khách đặc tả số lượng phục vụ cùng hỗ trợ một dịch vụ file. Hệ điều hành quảng bá yêu cầu đó và gắn phục vụ đầu tiên đáp ứng được yêu cầu.

Gắn file là cách thuận tiện để đạt được tính trong suốt định vị truy nhập file. Tuy nhiên, gắn khởi động đòi hỏi tri thức định vị phục vụ file, vì điều đó, giao thức gắn là không trong suốt. Trong hệ thống có nhiều phục vụ file cung cấp cùng một dịch vụ file, thông tin định vị không còn thích hợp với khách. Phục vụ file có thể được định vị theo hai cách:

(1) Phục vụ file ghi nhận dịch vụ của nó bằng một dịch vụ ghi nhận và khách tra cứu phục vụ ghi nhận trước khi gắn,

(2) Khách quảng bá yêu cầu gắn và phục vụ file đáp ứng yêu cầu của khách.

Cả hai tiếp cận về cơ bản là giao thức giải pháp tên hoặc giải pháp địa chỉ. Đối với DFS, dịch vụ ghi nhận cung cấp lợi thế về hiệu năng. Phục vụ ghi nhận chỉ dẫn tới (đáp ứng) phục vụ file tốt nhất, hoặc phục vụ file làm cân bằng tải hệ thống cho yêu cầu của khách dựa trên tri thức của phục vụ ghi nhận về hệ thống. Phục vụ ghi nhận ứng xử giống như một thương gia thông minh trong hệ tự trị cộng tác. Khi dùng chính sách hợp lý, khách cũng có thể chọn một trả lời nhận được qua quảng bá. Tuy nhiên, thông tin kết nối thường trực trong nhân khách có thể được xem xét như cache. Nếu phục vụ file chuyển dời sang máy tính khác, truy nhập file tới phục vụ sẽ thiếu vắng cache. Một trong hai giao thức giải pháp được kích hoạt để tìm định vị mới của phục vụ bỏ qua sự can thiệp của khách. Kết quả là hoàn thành được tính độc lập định vị file.

Gắn hệ thống file từ xa thường được xếp chồng nhau. Hệ thống file được gắn có thể có thư mục nào đó được gắn từ một phục vụ file khác. Trong trường hợp đó, lặp lại tên đường dẫn đòi hỏi dọc theo bảng gắn đa thành phần trải trên phạm vi các máy tính. Khả năng phục vụ file đích sẵn sàng cho truy nhập song vấn đề là phục vụ file trung gian lại ngăn cản khách vươn tới file. Dùng giải pháp cho phép truy nhập trực tiếp tới file mỗi khi file được định vị. Thông tin này có thể được lưu trong cache đối với mọi file từ xa được mở. Giải pháp địa chỉ dựa trên đường dẫn mạng thích hợp hơn so với trên hệ thống file.

Phục vụ file có trạng thái và thiếu trạng thái

Phiên dãy thao tác file giống như kết nối dãy hỏi/đáp giữa khách và phục vụ file. Kết nối về bản chất là yêu cầu thiết lập và kết thúc một phiên truyền thông. Hơn nữa, tồn tại thông tin trạng thái tương ứng với mỗi phiên file (kết nối). Một số thông tin trạng thái điển hình là:

- Các file được mở và khách của chúng,

- Đặc tả file và thẻ file,

- Con trỏ định vị file hiện thời,

- Thông tin gắn,

- Tình trạng khóa,

- Khóa phiên,

- Cache hoặc buffer.

Thông tin trạng thái được duy trì động trong khi file đang được sử dụng. Chúng khác với thuộc tính file (thể hiện tính chất tĩnh của file). Vì lý do gì và khi nào thông tin trạng thái là cần đến? Bắt đầu từ thông tin đầu tiên trong danh sách trên, trạng thái buộc phải chứa file nào đang được mở và khách nào mở. Thông tin này được thường trực hoặc tại khách hoặc tại phục vụ hoặc cả hai. Tiếp theo, nhằm tránh lặp việc gọi dịch vụ thư mục cho mỗi lần truy nhập file, một đặc tả file và thẻ file của nó được cho đối với mỗi file mở và duy trì tại nhân của khách. Đối với những lần truy nhập tiếp theo, một con trỏ định vị file ẩn tương ứng với mỗi phiên file mở. Khi một file chia xẻ được mở bởi nhiều khách, mỗi phiên file mở có con trỏ định vị file hiện thời của nó, ngoại trừ trường hợp thừa kế. Trong những trường hợp này, clinet thừa kế file từ cha của nó và con trỏ định vị file được chia xẻ cho QT cha và con. Con trỏ định vị file được bảo quản cùng với thông tin về file mở. Kế tiếp trong danh sách là thông tin gắn. Nhân của khách duy trì thông tin kết nối tới file ở xa. Phục vụ không cần biết file được gắn bởi khách nào mỗi khi file của nó được gắn.

Để điều phối chia xẻ file, thường muốn cho phép khách có năng lực khóa file. Do khóa là thông tin toàn cục chia xẻ bởi các khách, hợp lý là phục vụ file quản lý thông tin này. Một ví dụ khác về chia xẻ thông tin là khóa phiên trong truyền thông. Tồn tại một số khái niệm khi dùng khóa phiên để truyền thông an toàn giữa khách và phục vụ file. Khi xem xét trạng thái của một kết nối giữa khách với phục vụ file, đơn giản giả thiết khóa phiên là một bí mật thỏa thuận giữa phục vụ file và khách của nó, và khóa là thông tin trạng thái. Một số giao thức truyền thông an toàn hiện có dùng khóa phiên một lần. Trong tình huống này thì không cần bảo quản khóa như phần thông tin trạng thái. Cuối cùng, cache và buffer có thể được dùng hoặc tại khách hoặc phục vụ nhằm rút ngắn độ trễ. Thi hành cache và buffer là hữu dụng khi yêu cầu truy nhập đưa ra từ các QT cục bộ. Dữ liệu trong cache và buffer là thông tin trạng thái của kết nối.

Rõ ràng là thông tin trạng thái của phiên file có thể được phân tán giữa khách và phục vụ file truyền thông. Việc phân chia thông tin trạng thái có ảnh hướng tới hiệu năng và quản lý của hệ thống file phân tán. Rõ ràng là, khách đòi hỏi duy trì những thông tin này. Cái gì mà phục vụ file cần đến đối với một phiên mở để phiên được xác định. Một phục vụ file được gọi là đủ trạng thái nếu nó duy trì thông tin trạng thái nào đó và được gọi là thiếu trạng thái nếu nó không duy trì một thông tin nào. Khi càng biết nhiều về kết nối thì càng mềm dẻo khi thực hiện điều khiển trên nó. Tuy nhiên, ý niệm về trạng thái là cái mà cần tránh xa càng nhiều càng hợp lý trong thiết kế hệ phân tán. Phục vụ file thiếu trạng thái là dễ dàng thi hành hơn và là thứ lỗi hơn theo hỏng hóc khách và chủ so với việc lưu giữ vết của thông tin trạng thái. Sự thỏa hiệp nằm giữa mềm dẻo và đơn giản. Do hỏng hóc là thường xuyên hơn trong hệ phân tán, nhiều thi hành DFS chọn thi hành dịch vụ file thiếu trạng thái. Hỏng hóc khách không ảnh hưởng tới phục vụ file. Sụp đổ của dịch vụ file thiếu trạng thái dễ khôi phục lại và được các khách khác nhận biết như là chậm trễ trả lời (hoặc không có trả lời) mà không cần phá vỡ phiên của chúng. Đối với dịch vụ file thiếu trạng thái, mỗi yêu cầu file tới phục vụ cần chứa thông tin đầy đủ về thẻ file, con trỏ định vị, khóa phiên, và các thông tin cần thiết khác. Thi hành phục vụ file thiếu trạng thái cần nhắm tới các vấn đề sau đây:

(1) Nhu cầu bất biến: Phục vụ file làm gì khi khách lặp hợp lý một yêu cầu do hỏng hóc trước đây (không nhận được trả lời) của phục vụ ? Thực tế hay không khi cấu trúc mọi truy nhập file như thao tác bất biến ?

(2) Cơ chế khóa file: Làm cách nào các khách chia xẻ thi hành cơ chế khóa file dựa trên phục vụ file thiếu trạng thái ? Nên chăng cơ chế khóa file được tích hợp vào dịch vụ giao dịch ?

(3) Quản lý khóa phiên: Làm cách nào để khóa phiên được sinh và được duy trì giữa khách và phục vụ file thiếu trạng thái truyền thông ? Có thể dùng khóa phiên một-lần cho mỗi lần truy nhập file ?

(4) Tính nhất quán cache: Phục vụ file có phải chịu trách nhiệm điều khiển tính nhất quán cache giữa các khách ? Ngữ nghĩa chia xẻ nào được hỗ trợ ?

Những biện luận trên đây chỉ ra rằng, về khái niệm phục vụ file thiếu trạng thái là đơn giản và hấp dẫn, thì trong thi hành thực tế một vài thông tin trạng thái tối thiếu cần được phục vụ duy trì. Nhu cầu bất biến và vấn đề khóa phiên chia xẻ đã được chỉ ra trong chương 4 khi bàn luận về thi hành RPC. Giải pháp này được áp dụng tới phục vụ file nếu lời gọi thủ tục từ xa được dùng để yêu cầu dịch vụ file. Khóa file và nhất quán cache được bàn luận tiếp.

Truy cập file và ngữ nghĩa của chia xẻ

Độ phức tạp thi hành truy nhập đồng thời tới file chia xẻ từ xa phụ thuộc vào cách file được chia xẻ như thế nào và ngữ nghĩa của chia xẻ file được xác định từ người dùng.

Truy nhập file

Chia xẻ file có nghĩa rằng đa khách có thể truy nhập cùng một file tại cùng một thời điểm. Chia xẻ là kết quả của các thao tác truy nhập hoặc gối nhau hoặc xen kẽ nhau.

Truy cập gối nhau ngụ ý rằng có nhiều bản sao của cùng một file và đồng thời được thực hiện bởi đa thành phần không gian của file. Một ví dụ về nơi dữ liệu của file có thể được nhân bản là việc dùng cache. Để thuận lợi đưa bộ phận của file từ xa về cache cục bộ để truy nhập nhanh. Tương tự, đôi khi cần duy trì bản sao làm việc của một file trước khi một thay đổi lâu dài được làm trên file đó. Trong cả hai tình huống, bản sao nhân bản của file dữ liệu chia xẻ tồn tại và truy nhập đồng thời tới file trở thành thực hiện được. Mỗi vị trí có bản sao của file được nhân bản cho khung nhìn khác nhau đối với dữ liệu. Quản lý truy nhập tới bản sao cung cấp khung nhìn kết cấu của file được chia xẻ được gọi là điều khiển kết cấu (coherency control).

Truy nhập xen kẽ nhau do tính đa hạt thao tác truy nhập dữ liệu. Một vài truy nhập file đơn giản là thao tác đọc/ghi. Truy nhập khác lại bao gồm dãy các thao tác xen kẽ nhau trải dọc theo khoảng thời gian người dùng định sẵn, chẳng hạn như giao dịch hoặc phiên. Thực hiện xen kẽ nhau trên cùng một file cũng tạo ra một ảo giác về chia xẻ file đồng thời. Tính đồng thời được thực hiện bởi tính đa thành phần theo thời gian của file. Vấn đề quản lý ở đây là làm cách nào định trước ảnh hưởng một dãy thực hiện từ các dãy khác khi chúng xen kẽ nhau và làm cách nào ngăn ngừa kết quả không nhất quán hoặc có lỗi. Bài toán này thường được nói đến như là bài toán điều khiển đồng thời (concurrency control).

Không gianThời gian Truy nhập từ xa Truy nhập cache Truy nhập tải lên/xuống
RW đơn giản Không chia xẻ thực sự Điều khiển nhất quán Điều khiển nhất quán
Giao dịch Điều khiểnđồng thời Nhất quán và đồng thời Nhất quán và đồng thời
Phiên Không thích hợp Không thích hợp Bỏ qua chia xẻ

Hình 6.5. Tính đồng thời không gian và thời gian truy nhập file

Hình 6.5. cho tính đa thành phần không gian và thời gian nhằm thực hiện hiệu quả việc truy nhập đồng thời tới file chia xẻ. Mục trong bảng là chức năng quản lý được yêu cầu đối với mỗi giả thiết chia xẻ.

Trong phạm vi không gian, truy nhập đọc và ghi được thi hành theo một trong các cách sau, tùy thuộc vào dữ liệu trong file được trình diễn cho truy nhập như thế nào:

(1) Truy nhập từ xa: Không có dữ liệu file được giữ trong máy khách. Mỗi yêu cầu truy nhập được truyền trực tiếp tới phục vụ file ở xa, thông qua mạng hạ tầng.

(2) Truy nhập cahce: phần nhỏ của dữ liệu file được duy trì trong cache cục bộ. Thao tác ghi hoặc vắng cache tạo ra một truy nhập từ xa và cập nhật lại cache đó.

(3) Truy nhập tải lên/tải xuống: Toàn bộ file được tải xuống cho truy cập cục bộ. Truy nhập từ xa hoặc tải lên được thực hiện khi cập nhật file từ xa.

Tiếp cận đầu tiên là mô hình truy nhập đơn mức, còn các tiếp cận khác là trình bày bảo quản phân cấp hai mức đối với dữ liệu. Thi hành mô hình truy nhập từ xa đơn mức là trực tiếp do chỉ một bản sao của dữ liệu là tồn tại, và mọi yêu cầu truy nhập là tuần tự bởi phục vụ file. Mặt hạn chế nguyên thủy là độ trễ truy nhập mạng dài và hạn chế tính đồng thời. Mô hình cache và tải lên/tải xuống cho phép tính đồng thời và rút ngắn trễ truy nhập bằng cách giữ bộ phận / toàn bộ truy nhập là cục bộ. Tuy nhiên, tiệm cận này đưa đến bài toán kết cấu file. Do dữ liệu trong file được nhân bản và được chia xẻ cho một số người dùng đồng thời, file chia xẻ trình diện có thể khác nhau với những khách đồng thời khác nhau. Điều khiển kết cấu đối với bản sao dữ liệu là một bài toán không tầm thường. Kết cấu của dữ liệu nhân bản có thể được giải thích theo nhiều cách khác nhau. Những giải thích (định nghĩa) dưới đây được liệt kê theo một thứ tự nghiêm ngặt:

(1) Mọi bản sao là đồng nhất tại mọi thời điểm,

(2) Các bản sao được định sẵn đồng nhất tại chỉ một số thời điểm nhất định,

(3) Người dùng luôn đọc được dữ liệu "hiện thời nhất" trong bản sao,

(4) Thao tác ghi luôn được thực hiện "ngay lập tức" và kết quả của nó được truyền bá theo cách cố gắng nhất.

Định nghĩa (1) về tính kết cấu là lý tưởng song không thể thực hiện trong hệ phân tán do trễ truyền thống đáng kể. Bởi vậy, chấp nhận thực tế là không phải mọi bản sao là đồng nhất tại mọi thời điểm. Định nghĩa (2) là sự thỏa hiệp song lại khó xác định điểm đồng bộ tốt. Sự lưu hành dữ liệu là có ý nghĩa chỉ cần tại thời điểm đọc chúng. Như vậy, định nghĩa (3) có vẻ lôgic. Vướng mắc ở chỗ tính phỏng chừng của thuật ngữ, hiện thời nhất, (hoặc muộn nhất). Thứ tự tương đối của các thao tác ghi cần dựa trên thời điểm "hoàn thiện" chúng, là thời điểm kết quả của thao tác ghi đó phẩn ánh trong mọi bản sao. Một giao thức cần đến một thao tác đọc luôn phải cho kết quả của thao tác ghi hiện thời nhất. Định nghĩa (4) là một cố gắng thô sơ nhằm xấp xỉ định nghĩa (3).

Bài toán kết cấu file là thích đáng cho sự tồn tại của dữ liệu nhân bản và cập nhật bị làm trễ của khách tới bản sao. Kết cấu là bài toán hệ trọng hơn trong hệ phân tán do trễ mạng là dài hơn và kém dự báo hơn. Sự phức tạp của vấn đề trễ là nhân tố mà hỏng hóc (khách, phục vụ hoặc truyền thông) xảy ra thường xuyên hơn trong hệ phân tán. Hỏng hóc trong khi cập nhật file có thể đưa file về trạng thái không nhất quán. Một mong muốn cao đối với hệ thống đảm bảo tính nguyên tử của cập nhạt, chẳng hạn mỗi thao tác cập nhật hoặc hoàn thiện thành công hoặc không có kết quả nào. Với đa bản sao của cùng một file, một cập nhật file là nguyên tử nếu tất cả hoặc không bản sao nào được cập nhật. Cập nhật nguyên tử đòi hỏi hệ thống là thu hồi được (recoverable) (tức là, có khả năng hủy -undo- một cập nhật từng phần và phục hồi lại hệ thống trở về trạng thái trước khi cập nhật từng phần). Thao tác hủy bao hàm việc dùng lưu giữ trạng thái bền vững (stable) mà có thể được dùng khi khôi phục trạng thái hệ thống trong việc ứng phó với mọi hỏng hóc hệ thống. Tính nguyên tử của cập nhật nguyên tử của nhận bản được giới thiệu trong ngữ cảnh truyền thông đa tán phát nguyên tử. Điều này được xem xét thêm theo khung nhìn dữ liệu và giao thức quản lý nhân bản.

Trong phạm vi thời gian, các thao tác file có liên quan có thể được nhóm lại theo những đoan thời gian khác nhau tùy theo nhu cầu áp dụng chúng. Các thao tác đọc và ghi từ các QT khác nhau dẫn tới truy nhập file đồng thời. Một số giả thiết về truy nhập file là:

(1) RW đơn giản: Mỗi thao tác đọc và ghi là một truy nhập hỏi/đáp độc lập tới phục vụ file;

(2) Giao dịch: Một dãy các thao tác đọc và ghi được xem xét như là một đơn vị cơ sở truy nhập file (với một số đòi hỏi ngữ nghĩa bổ sung cho giao dịch). Về cú pháp, giao dịch được biểu diễn bởi một begin transaction tiếp theo là một số các truy nhập file và kết thúc với end transaction. Giao dịch ở đây được định nghĩa theo nghĩa hẹp là các thao tác đọc và ghi truy nhập tới cùng một file.

(3) Phiên: Phiên chứa một dãy các giao dịch và thao tác RW đơn giản với ngữ nghĩa bổ sung phù hợp với phiên được định nghĩa bởi ứng dụng. Điển hình, phiên được gói gọn trong cặp các thao tác mở và đóng file.

Truy nhập RW đơn giản và phiên là các khái niệm quen thuộc trong mọi hệ điều hành. Giao dịch là một khái niệm đồng bộ mức cao. Truy nhập dữ liệu của một giao dịch được chứa đựng trong cặp begin transaction/end transaction. Dãy các truy nhập (bao gồm cập nhật) là nguyên tử hoặc không thể chia cắt với nghĩa dãy các thao tác được thực hiện bỏ qua sự giao thoa từ các khách khác. Kết quả của việc thực hiện xen kẽ các truy nhập bởi nhiều khách là tương đương với sự thực hiện tuần tự của dãy, đưa dữ liệu từ trạng thái nhất quán này tới trạng thái nhất quán khác. Nếu các tính chất nguyên tử, nhất quán, cô lập và bền vững (ACID) dược đảm bảo (xem truyền thông giao dịch), truy nhập dữ liệu được tạo trong một giao dịch nguyên tử. Khái niệm giao dịch nguyên tử là phổ dụng với những ứng dụng thương mại. Chức năng làm hiệu lức tính nguyên tử và nhất quán trong phục vụ file được gọi là dịch vụ giao dịch.

Ngữ nghĩa của chia xẻ

Chia xẻ file sử dụng truy nhập đa thành phần không gian và thời gian đưa tới baif toán điều khiển kết cấu và đồng thời. Giải pháp tới bài toán phụ thuộc vào ngữ nghĩa của chia xẻ do các ứng dụng yeu cầu. Về lý tưởng, cần cập nhật một file là hoàn thiện ngay lập tức và kết quả của nó trở nên nhìn thấy được một cách tức thì đối với các QT chia xẻ khác. Về thực tế, ngữ nghĩa này là khó thực hiện và do đó thường là nhẹ nhàng hơn. Trễ của thao tác ghi là không thể tránh được trong hệ phân tán do kết quả của thao tác ghi có thể được trễ bởi mạng hoặc bởi dịch vụ hệ thống theo đòi hỏi kết cấu và nhất quán. Dùng quan điểm không gian và thời gian như hình 6.5, có danh sách ba mô hình phổ biến nhất cho các mục tiêu khác nhau của chia xẻ file:

(1) Ngữ nghĩa UNIX: Kết quả của thao tác ghi được lan truyền tới file và các bản sao của nó tức thì sao cho các thao tác đọc sẽ nhận được giá trị "muộn nhất" của file. Không bị chậm lệnh ghi phải chịu ngoại trừ trễ mạng tất yếu. Truy nhập tiếp theo của khách phát ra thao tác ghi buộc phải chờ thao tác ghi hoàn thiện. Mục tiêu nguyên thủy là duy trì tính hiện thời của dữ liệu.

Việc chia xẻ nội dung

Khi sử dụng file chung truy cập thời gian ảnh hưởng sự liên kết và điều khiển. Giải pháp cho vấn đề này phụ thuộc vào yêu cầu chia xẻ của ứng dụng. Thực tế chúng ta muốn cập nhật hoá một cách hoàn toàn tới file và có ngay kết quả của quả trình chia xẻ. Trường hợp đặc biệt nội dung này khó đạt được và luôn bị giảm xuống. Thời gian trễ là không tránh khỏi trong hệ phân tán vì quá trình ghi bị trì hoãn ảnh hưởng bởi mạng hoặc hệ thống dịch vụ khác cố định có liên kết với nó. Sử dụng khái niệm không gian và thời gian ta lập ba mô hình nội dung có thực thể khác nhau cho file chia xẻ:

Nội dung HĐH (UNIX): Kết quả quá trình ghi truyền tới file và được sao ra lập tức, thao tác đọc trở thành công việc mới nhất của file. Không có sự trễ nào trừ sự trì hoãn của mạng là không tránh khỏi. Truy cập từ máy PC phải chờ quá trình ghi hoàn thành, khoá duy trì dữ liệu hiện thời.

Nội dung công việc: Kết quả quá trình ghi có thể không lưu trong vùng nhớ đang làm việc và chuyển đổi chỉ khi vài kết quả cố định bắt buộc để ở cuối quá trình. Đối tượng khoá duy trì dữ liệu cố định.

Nội dung đoạn: Ghi vào file thể hiện qua sự nhân bản, kết quả tạo ra cố định chỉ tại nơi kết thúc đoạn. Nội dung khoá duy trì sự truy cập dữ liệu có hiệu quả.

Khác biệt chính giữa nội dung HĐH và 2 loại khác là sự trễ trong quá trình ghi. Unix cho phép ghi ngay hiệu quả trong khi nội dung đoạn và công việc sử dụng độ trễ. Unix dễ thao tác với bộ xử lý đơn nơi mà dữ liệu được lưu trong các file cơ bản, file chung không được định danh và mọi thao tác đọcghi trực tiếp bởi file chủ. Nếu dữ liệu được lưu trong một quá trình xử lý cơ bản (thường trong hệ thống phân tán) nhiều bộ nhớ nhỏ chứa cùng file dữ liệu có thể tồn tại. Yêu cầu ghi vào file chủ xử dụng điều kiện kế hoạch lưu. Tuy vậy kết quả không đúng trừ khi bộ nhớ vừa được cập nhật hoá. Vấn đề cùng lưu bộ nhớ về logic phức tạp như vấn đề bộ nhớ cố định trong hệ thống bộ nhớ phân tán chia xẻ. Cách thức ghi đúng và cập nhật như thế nào được thảo luận ở chương sau.

Thông tin đúng trên file chủ lưu dữ liệu được cập nhật thường xuyên. Truy cập file bằng việc ghi vào bộ nhớ định danh mô hình nội dung. Thao tác ghi vào bộ nhớ không hiệu quả bằng thao tác đọc. Cải tiến quá trình ghi bằng cách ngừng ghi nếu mọi quá trình ghi vào file chủ không cần thiết ngay lập tức. Rất khó để quyết định quá trình ghi có ảnh hưởng tới quá trình không, giải pháp là ghi vào file chủ một cách có định ký, không ảnh hưởng tới quá trình xử lý khác. Chiến lược điều khiển ghi trực tiếp vào bộ nhớ lfm việc truy cập tăng lên không được duy trì chính xác trong nội dung UNIX.

HĐH cố gắng chia xẻ dữ liệu toàn bộ cho các máy PC, trong nhiều trường hợp nó giải quyết sự lãng phí. Vài ứng dụng không liên quan đến bản sao, dữ liệu cố định bị xâm phạm. Hệ thống chỉ đòi hỏi kết quả thực hiện cân bằng thao tác thực hiện đoạn. Việc cập nhật file cố định lâu hơn trong mô hình nội dung công việc. Mỗi khách chứa file sao từ file chủ có thể sửa đổi nội dung file sao tới hết đoạn file, khi file đóng sửa đổi file được sao từ file chủ. Tính chất này không được áp dụng nếu có nhiều khách. Việc chia xẻ hạn chế giữa nhiều khách sẽ dễ thực hiện và áp đáp ứng đầy đủ các yêu cầu ứng dụng.

Điều khiển phiên bản

Mô hình nội dung đoạn có nhiều hạn chế. Yêu cầu đóng đoạn ngay sau quá trình ghi tương đương mô hình nội dung HĐH với quá trinhf ghi vào bộ nhớ. Yêu cầu file mới được tạo bằng cách sửa đổi file cũ (file cũ chỉ cho phép đọc). Mọi vấn đề với file lúc này là chia xẻ và tạo mới vì nó chỉ cho phép đọc. Để cùng ghi, khách phải biết tên file mới tạo. Giải pháp đơn giản của vấn đề là sử dụng cùng tên file nhưng khác phiên bản. Chức năng dịch vụ đường dẫn thực hiện việc điều khiển phiên bản. Mỗi file trong đường dẫn tương ứng với một số. File có số hiệu phiên bản cao nhất là file hiện tại. Nếu một phiên bản hiện tại được truy cập bởi nhiều khách khác thì có ba cách thể hiện phụ thuộc vào dữ liệu trong file đang chia xẻ và sửa đổi như thế nào?

Lờ đi sự xung đột: Một phiên bản mới được tạo bất chấp điều gì xảy ra.

Phiên bản giải quyết lại sự xung đột: giả thiết dữ liệu thay đổi trong phiên bản không tương thích với phiên bản mới hiện tại. Kết quả việc cập nhật hoá có mâu thuẫn. Vấn đề này được giải quyết bằng việc cập nhật hoá phiên bản hiện tại với phiên bản mới (kết nối mọi cập nhật).

Giải quyết một chuỗi xung đột: giả sử dữ liệu đã được sửa đổi trong phiên bản hiện tại. Việc cùng cập nhật hoá có thể dẫn đến một chuỗi và chạm (mâu thuẫn). Giải pháp là lờ đi hoặc nhảy qua công việc của khách với một phiên bản mới đồng thời cập nhật theo trật tự tuỳ ý.

Nhiều xung đột phức tạp và điều khiển phiên bản có thể giải quyết phụ thuộc vào yêu cầu ứng dụng. Sử dụng file cố định không giải quyết vấn đề hơn là quan tâm tới dịch vụ file và các hệ thống dịch vụ khác. Để giảm yêu cầu bộ nhớ của nhiều tổ chức phiên bản, một phiên bản mới phải chứa tính chất thay đổi trường file (khối). Số hiệu phiên bản phụ thuộc sự thay đổi khối. Duy trì rãnh thay đổi khối dễ tạo sự xung đột cao.