Giao Trinh GIS

HỆ THỐNG THÔNG TIN ĐỊA LÝ
GEOGRAPHICAL INFORMATION SYSTEM

Các kỹ thuật phân tích không gian (spatial analytical technicques) có nhiệm
vụ phân tích theo trật tự và tổ hợp không gian của các hiện tượng hoặc các yếu tố
(tự nhiên - kinh tế - xã hội). Mối liên quan đó được cụ thể bằng trật tự không gian
địa lý, nghĩa là mọi hiện tượng và tính chất của các yếu tố cần phải được bản đồ
hóa.
Bản đồ là cách trình bày cụ thể nhất trong không gian hai chiều các tính chất,
vị trí, mối liên hệ và trật tự trong không gian của các đối tượng hoặc hiện tượng
cần nghiên cứu. Tuy nhiên do có nhiều cách trình bày bản đồ khác nhau nên dẫn
đến sự khó khăn trong việc xử lý mối quan hệ không gian giữa các lớp thông tin.
Trong hơn một thập kỷ qua, hệ thống thông tin địa lý đã được phát triển
mạnh mẽ và ngày càng thêm hoàn thiện. Với những ưu thế của mình, hệ thông tin
địa lý- geographical information system ( HTTĐL) là một môi trường có khả năng
quản lý hệ thống cơ sở dữ liệu và xử lý chính xác các lớp thông tin trong mối quan
hệ không gian giữa chúng. HTTĐL có khả năng bổ sung, đo đạc và tự động tính
toán chính xác về mặt định lượng các thông tin trên bản đồ, cùng các thuộc tính
của chúng, đồng thời có thể đưa ra các tính toán dự báo.
I.CÁC KHÁI NIỆM CƠ BẢN VỀ HTTĐL

I.1.Định nghĩa
Hệ thông tin địa lý (HTTĐL)- Geographical information system ( GIS) là
một tổ chức tổng thể của bốn hợp phần: phần cứng máy tính, phần mềm, tư liệu
địa lý và người điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp
nhận, lưu trữ, điều khiển, phân tích và hiển thị toàn bộ các dạng dữ liệu địa lý.
HTTĐL có mục tiêu đầu tiên là xử lý hệ thống dữ liệu trong môi trường không
gian địa lý. (Viện nghiên cứu môi trường Mỹ - 1994).
Một định nghĩa khác có tính chất giải thích, hỗ trợ là: HTTĐL là một hệ
thống máy tính có chức nănng lưu trữ và liên kết các dữ liệu địa lý với các đặc tính
của bản đồ dạng đồ họa, từ đó cho môt khả năng rộng lớn về việc xử lý thông tin,
hiển thị thông tin và cho ra các sản phẩm bản đồ, các kết quả xử lý cùng các mô
hình (antenucci 1991)
Một con đường hoặc con sông, con suối thường được biểu diễn bằng các yếu
tố đường, mặc dù trong thực tế có thể đo được cả độ rộng và chiều dài của chúng
trên bản đồ. Các đối tượng tự nhiên thường được thể hiện bằng các đường, cung,
vùng, điểm, tuỳ theo các đặc trưng cụ thể mà chúng được thể hiện theo các hình
mẫu cụ thể.
Hình 1. Mô tả một số khái niệm vector nguồn

Một số khái niệm chính được cụ thể trong định nghĩa này như sau:
• Đường (line): là các đối tượng có một kích thước.
• Đoạn thẳng (line segment): là đường nối trực tiếp giữa hai điểm.
• Đường gấp khúc: là các đọan thẳng nối liên tục, có thể khác hướng song
không có điểm nối hoặc có thể điểm nối ở một phía (phải hoặc trái). Đường gấp
khúc có thể cắt qua chính nó hoặc cắt các đường khác.
• Cung (area) là một đoạn tập hợp các điểm tạo nên một dạng đường cong
mà đường cong đó được xác định bằng một hàm toán.
• Đoạn nối (link) là đối tượng có một kích thước nối giữa hai nút. Đoạn nối
cũng được hiểu là đường gờ (edges) hay đường viền.
• Đoạn nối trực tiếp : là đoạn nối giữa hai nút với một hướng nhất định.
• Dây xích (chain): là sự nối liên tục của các đoạn thẳng không cắt nhau
hoặc giữa các cung với các nút ở cuối mỗi cung. Các nút có thể nằm ở bên phải
hay bên trái là không bắt buộc
• Vùng: là đặc điểm thể hiện hai kích thước cả vị trí và diện tích, là đối
tượng xác định về mặt ranh giới, liên tục và có hai kích thước. Nó có thể bao gồm
cả phần bên hoặc không
I.2.Cấu trúc của HTTĐL
HTTĐL bao gồm các hợp phần cơ bản như sau: tài liệu không gian, người
điều hành, phần cứng, phần mềm (hình 2).
Hình 2. Mô hình tổ chức của HTTĐL

Dữ liệu không gian: Dữ liệu không gian cỏ thể đến từ nhiều nguồn, có các
nguồn tư liệu sau: số liệu tính toán thống kê, báo cáo, các quan trắc thực địa, ảnh
vệ tinh, ảnh máy bay, bản đồ giấy (dạng analog). Kỹ thuật hiện đại về viễn thám
và HTTĐL có khả năng cung cấp thông tin không gian bao gồm các thuộc tính địa
lý, khuôn dạng dữ liệu, tỷ lệ bản đồ và các số liệu đo đạc. Việc tích hợp các tư liệu
địa lý từ nhiều nguồn khác nhau là đặc điểm cơ bản của một phần mềm HTTĐL.
Thông thường, tư liệu không gian được trình bày dưới dạng các bản đồ giấy
với các thông tin chi tiết được tổ chức ở một file riêng. Các tư liệu đó không đáp
ứng được các nhu cầu hiện nay về tư liệu không gian là vì những lý do sau:
- Đòi hỏi không gian lưu trữ rất lớn, tra cứu khó khăn. Để nhập và khai
thác dữ liệu, nhất thiết phải liên kết được với các thông tin địa lý trên bản đồ và
các dữ liệu thuộc tính khác được lưu trữ riêng biệt và điều này trở nên rất khó
khăn với hình thức lưu trữ dạng kho hoặc thư viện.
- Các khuôn dạng lưu trữ truyền thống thường không tương thích với các
tiêu chuẩn dữ liệu hiện nay. Thay thế cho các dữ liệu dạng truyền thống, hiện nay
tư liệu dạng số với một khối lượng rất lớn có thể được lưu trữ trong các đĩa CD,
tương ứng với những khối lượng rất lớn của tư liệu analoge. Tư liệu số còn cho
khả năng xử lý tự động trên máy tính.
Như vậy, HTTĐL là sự phát triển đặc biệt để sử dụng công nghệ và nghệ
thuật máy tính trong việc xử lý tư liệu không gian dạng số.
Người điều hành
Vì HTTĐL là một hệ thống tổng hợp của nhiều công việc kỹ thuật, do đó đòi
hỏi người điều hành phải được đào tạo và có kinh nghiệm trong nhiều lĩnh vực.
Người điều hành là một phần không thể thiếu được của HTTĐL. Hơn nữa sự phát
triển không ngừng của các kỹ thuật phần cứng và phần mềm đòi hỏi người điều
hành phải luôn được đào tạo. Những yêu cầu cơ bản về người điều hành bao gồm
các vấn đề sau:
Có kiến thức cơ bản về địa lý, bản đồ, máy tính và công nghệ thông tin:
- Việc đào tạo cơ bản về địa lý cung cấp khả năng khai thác các đặc điểm
không gian (spatical process) và các quá trình không gian, đồng thời phát hiện
được mối quan hệ không gian giữa các hợp phần.
- Bản đồ học cung cấp các hiểu biết về thiết kế bản đồ, lập bản đồ (ví dụ:
Lưới chiếu bản đồ, hệ thống tọa độ, các mẫu ký tự trên bản đồ và các kỹ thuật in
ấn).
- Khoa học về máy tính và thông tin cung cấp các kiến thức cơ bản về phần
cứng máy tính và vận hành thông thạo các chương trình liên kết phần cứng.
- Có kinh nghiệm trong việc sử dụng các phần mềm HTTĐL: việc đào tạo
các phần mềm chủ yếu thường tập trung vào việc xử lý HTTĐL, lập trình cơ bản,
quản lý cơ sở dữ liệu và một số công việc khác có liên quan đến tích hợp thông
tin.
- Có hiểu biết nhuần nhuyễn về dữ liệu: hiểu về nguồn dữ liệu, nội dung và
độ chính xác của dữ liệu, tỷ lệ bản đồ nguyên thủy và các số liệu đo đạc của tập dữ
liệu, cấu trúc của dữ liệu.
- Có khả năng phân tích không gian. Yêu cầu được đào tạo về các phương
pháp xử lý thống kê và xử lý định tính trong địa lý, việc đào tạo cho người xử lý
có thể lựa chọn phương pháp tốt nhất để phân tích và áp dụng nhằm đưa ra kết quả
tốt nhất.
Các yêu cầu trên là cần thiết đối với người điều hành HTTĐL. Các huấn
luyện chi tiết sẽ tùy thuộc nội dung và mục tiêu cũng như khả năng của máy tính và
phần mềm để lực chọn những chương trình đào tạo thích hợp.
Phần cứng (máy tính và thiết bị ngoại vi)
• Phần cứng của một HTTĐL bao gồm các hợp phần sau: Bộ xử lý trung
tâm (CPU), thiết bị nhập dữ liệu, lưu dữ liệu và thiết bị xuất dữ liệu.
• Bộ xử lý trung tâm (central processing unit - CPU): hệ thống điều khiển,
bộ nhớ, tốc độ xử lý là những yếu tố quan trọng nhất của CPU. Hiện nay xử lý
HTTĐL trên nền unix là hệ thống có đủ các chức năng nhất, trong khi với máy CP
thì HTTĐL có những chức năng hạn chế hơn. Các hệ xử lý GIS trước đây, phần
lớn đều chạy trong trạm Unix. Trạm Unix cho phép lưu trữ cơ sở dữ liệu lớn và
nhiều chức năng xử lý khác nhau. Tất nhiên với sự trợ giúp của window NT thì PC
cũng có thể so sánh được với hệ unix. Ví dụ điểm hình về một hệ thống có hiệu
quả là một hệ Unix nhỏ có cài đặt phần mềm ARC/INFO để quản lý và vận hành
HTTĐL. Hiện nay, các hệ thống xử lý liên tục được nâng cấp và khoảng cách giữa
trạm Unix và PC càng hẹp dần.
• Nhập, lưu dữ và xuất dữ liệu: các thiết bị ngoại vi phục vụ cho việc nhập
dữ liệu là: Bàn số hoá, máy quét để chuyển đổi dữ liệu analoge thành dạng số.
Hoặc đọc băng và đĩa CD - ROM có nhiệm vụ lấy thông tin hiện có trong băng và
đĩa. Các phương tiện thông dụng là ổ đĩa cứng, ổ đọc băng, ổ đĩa quang có thể ghi
và xoá dữ liệu. Thiết bị xuất dữ liệu bao gồm máy in đen trắng và màu, báo cáo,
kết quả phân tích, máy in kim (plotter). Hiện nay, với sự phát triển của công nghệ
tin học và điện tử, đặc biệt là khi có thiết bị mạng cho phép san sẻ các chức năng
và trao đổi giữa những người sử dụng và càng tạo điều kiện cho HTTĐL phát
triển.
Phần mềm
Một hệ thống phần mềm xử lý HTTĐL yêu cầu phải có hai chức năng sau: tự
động hoá bản đồ và quản lý cơ sở dữ liệu. Sự phát triển kỹ thuật HTTĐL hiện đại
liên quan đến sự phát triển của hai hợp phần này.
• Tự động hoá bản đồ: bản đồ học là môn khoa học, nghệ thuật và kỹ thuật
thành lập bản đồ. Do đó, tự động hoá bản đồ là thành lập bản đồ với sự trợ giúp
của máy tính. Một bản đồ là sự thể hiện bằng đồ họa của mối quan hệ không gian
và các hình dạng (Pobinson và NNK, 1984) và mỗi một bản đồ là sự mô hình hoá
thực tế theo những tỷ lệ nhất định. Mô hình đó yêu cầu biến đổi các số liệu ghi bản
đồ thành bản đồ và gồm các công đoạn sau: Lựa chọn, phân loại, làm đơn giản hóa
và tạo mẫu ký tự (Den - 1990).
Máy tính trợ giúp cho bản đồ học ở nhiều phương diện như sau:
Trước hết, bản đồ trong máy tính là dạng số nên dễ dàng chỉnh sửa và việc
chỉnh lý đó tốn ít công sức hơn so với việc không có sự trợ giúp của máy tính.
Mặc dù việc số hóa có thể dẫn đến nhiều lỗi và làm giảm độ chính xác, song các
lỗi đó có thể sửa dễ dàng nếu phát hiện được. Khi đó, bản đồ sẽ được hoàn thiện
và lượng thông tin sẽ được nâng lên. Đặc biệt, việc bổ sung thông tin cho bản đồ
cũng dễ dàng thực hiện được.
Thứ hai, quá trình tạo chú giải và các chỉ dẫn lên bản đồ được thao tác với
tốc độ nhanh nên giá thành thấp. Việc lựa chọn, phân loại và làm đơn giản hóa các
đặc điểm bản đồ cũng được thực hiện một cách khoa học. Quá trình thiết kế và
khái quát hóa bản đồ cũng được lập trình và tạo nên các chức năng cụ thể của phần
mềm. Kết quả như mong muốn có thể đạt được bởi nhiều cán bộ bản đồ hoặc do
chính một cán bộ bản đồ làm trong nhiều thời gian khác nhau.
Thứ ba, thiết kế bản đồ có thể được hoàn thiện hơn qua việc thử và chỉnh sửa
lỗi. Kích thước, hình dạng hoặc vị trí của chữ hoặc ký hiệu trên bản đồ có thể dễ
dàng được thay đổi và đưa về vị trí chính xác như mong muốn.
• Quản lý dữ liệu: chức năng thứ hai của phần mềm HTTĐL là hệ thống
quản lý dữ liệu (data base management system DBMS). Hệ thống TTĐL phải có
khả năng điều khiển các dạng khác nhau của dữ liệu địa lý đồng thời có thể quản
lý hiệu quả một khối lượng lớn dữ liệu với một trật tự rõ ràng. Một yếu tố rất quan
trọng của phần mềm HTTĐL là cho khả năng liên kết hệ thống giữa việc tự động
hóa bản đồ và quản lý cơ sở dữ liệu. Các tài liệu mô tả cho một vị trí bất kỳ, có thể
liên hệ một cách hệ thống với vị trí không gian của chúng. Sự liên kết đó là một ưu
thế nổi bật của việc vận hành HTTĐL:
Thứ nhất: các tài liệu liệu thuộc tính nhất thiết phải được thể hiện trên những
chi tiết của bản đồ. Ví dụ số liệu về dân số của một thành phố cũng được gọi ra
một cách tự động mà không cần phải có một sự tra cứu nào khác. Đối với bản đồ
học thì công việc tra cứu thường phải làm độc lập, không thực hiện tự động được.
Ngoài ra việc bổ sung số liệu cũng đòi hỏi phải được cập nhật thường xuyên nên
chỉ HTTĐL mới có thể đáp ứng được đầy đủ.
Thứ hai: sự thay đổi về những chi tiết bản đồ nhất thiết phải phù hợp với sự
thay đổi về tự nhiên thuộc tính. Ví dụ, sự thay đổi về diện tích đô thị về số liệu
phải tương xứng với sự thay đổi về đường ranh giới thành phố. Khi thay đổi ranh
giới thì số liệu tính toán về diện tích cũng tự động được thay đổi.
II.CÁC CHỨC NĂNG CỦA PHẦN MỀM HTTĐL

Một phần mềm HTTĐL các các chức năng cơ bản như sau: nhập dữ liệu, lưu
trữ dữ liệu, điều khiển dữ liệu, hiển thị dữ liệu theo cơ sở địa lý và đưa ra những
quyết định (decision making) (Calkins và Tomlinson 1997). Có thể khái quát về
các chức năng đó như sau:
• Nhập và bổ sung dữ liệu (entry and updating): Một trong những chức
năng quan trọng của HTTĐL là nhập và bổ sung dữ liệu mà công việc đó không
tiến hành riêng rẽ. Bất kỳ một hệ thống nào cũng phải cho phép nhập và bổ sung
dữ liệu, nếu không có chức năng đó thì không được xem là một HTTĐL vì chức
năng đó là một yêu cầu bắt buộc phải có.
• Việc nhập và bổ sung dữ liệu phải cho phép sử dụng nguồn tự liệu dưới
dạng số hoặc dạng analog. Dạng tư liệu không gian như bản đồ giây hoặc ảnh vệ
tinh, ảnh máy bay phải được chuyển thành dạng số và các nguồn tư liệu số khác
cũng phải chuyển đổi được để tương thích với cơ sở dữ liệu trong hệ thống đang
sử dụng.
• Chuyển đổi dữ liệu: chuyển đổi dữ liệu là một chức năng rất gần với việc
nhập và bổ sung dữ liệu. Nhiều phần mềm thương mại cố gắng giữ độc quyền
bằng cách hạn chế đưa các khuôn dạng dữ liệu theo loại phổ cập. Tuy nhiên người
sử dụng phải lựa chọn để hạn chế việc phải số hóa thêm những tài liệu hiện đang
có ở dạng số. Trong thực tế, cùng một tư liệu nhưng có thể tồn tại ở nhiều khuôn
dạng khác nhau. Vì vậy, đối với tư liệu quốc gia, không thể chỉ lưu giữ ở một dạng
thuộc tính riêng biệt mà cần thiết phải lưu giữ ở nhiều khuôn dạng có tích chất phổ
biến để sử dụng được trong nhiều ứng dụng khác nhau. Như vậy, một phần mềm
HTTĐL cần phải có chức năng nhập và chuyển đổi nhiều khuôn dạng dữ liệu khác
nhau.
• Lưu giữ tư liệu: Một chức năng quan trọng của HTTĐL là lưu giữ và tổ
chức cơ sở dữ liệu do sự đa dạng và với một khối lượng lớn của dữ liệu không
gian: đa dạng về thuộc tính, về khuôn dạng, về đơn vị đo, về tỷ lệ bản đồ. Hai yêu
cầu cơ bản trong việc lưu trữ dữ liệu là: thứ nhất là phải tổ chức nguồn dữ liệu sao
cho đảm bảo độ chính xác và không mất thông tin, thứ hai là các tài liệu cho cùng
một khu vực song các dữ liệu lại khác nhau về tỷ lệ, về đơn vị đo... thì phải được
định vị chính xác và chuyển đổi một cách hệ thống để có thể xử lý hiệu quả.
• Điều khiển dữ liệu (data manipulation): Do nhiều HTTĐL hoạt động đòi
hỏi tư liệu không gian phải được lựa chọn với một chỉ tiêu nhất định được phân
loại theo một phương thức riêng, tổng hợp thành những đặc điểm riêng của hệ
thống, do đó HTTĐL phải đảm nhiệm được chức năng điều khiển thông tin không
gian. Khả năng điều khỉển cho phép phân tích, phân loại và tạo lập các đặc điểm
bản đồ thông qua các dữ liệu thuộc tính và thuộc tính địa lý được nhập vào hệ
thống. Các thuộc tính khác nhau có thể được tổng hợp, nắm bắt một cách riêng
biệt và những sự khác biệt có thể được xác định, được tính toán và được can thiệp,
biến đổi.
• Trình bày và hiển thị: Đây cũng là một chức năng bắt buộc phải có của
một HTTĐL. Không gian dưới dạng tài liệu nguyên thủy hay tài liệu được xử lý
cần được hiển thị dưới các khuôn dạng như: chữ và số (text), dạng bảng biểu
(tabular) hoặc dạng bản đồ. Các tính toán chung và kết quả phân tích được lưu giữ
ở dạng chữ và số để dễ dàng in ra hoặc trao đổi giữa các lỗ phần mềm khác nhau.
Các dữ liệu thuộc tính có thể được lưu ở dạng bảng biểu hoặc các dạng cố định
khác. Bản đồ được thiết kế để hiển thị trên màn hình hoặc lưu dưới dạng điểm
(plot file) để in. Như vậy, hiển thị và in ra là những chức năng rất cần thiết của
một HTTĐL.
• Phân tích không gian: Trước đây, chỉ có 5 chức năng mô tả ở trên là được
tập trung, phát triển bởi những người xây dựng HTTĐL. Chức năng thứ sáu là
phân tích không gian được phát triển một cách thần kỳ dựa vào sự tiến bộ của
công nghệ và nó trở nên thực sự hữu ích cho người ứng dụng. Những định nghĩa
về HTTĐL trước đây đã trở thành thực tiễn trên cơ sở ứng dụng trực tiếp chức
năng phân tích không gian. Theo quan điểm hiện nay thì chức năng đó cần thiết
phải có đối với một hệ thống được gọi là HTTĐL. Tất nhiên các chức năng có thể
khác nhau đối với từng hệ thống song đối với một một hệ thống TTĐL sử dụng tư
liệu bản đồ thì chức năng đó là băt buộc. Với một hệ thống như vậy thì các mô tả
bằng lời có thể tổ chức thành các tham số riêng, các mô hình giải thích, dự báo đều
có thẻ thực hiện trong chức năng xử lý không gian.
II.1.Sử dụng HTTĐL cho phân tích không gian
Phân tích không gian HTTĐL Bao gồm ba hoạt động chính: Giải quyết các
câu hỏi về thuộc tính, các câu hỏi về phân tích không gian và tạo nên tập dữ liệu
mới từ cơ sở dữ liệu ban đầu. Mục tiêu của việc phân tích không gian là từ việc
giải quyết các câu hỏi đơn giản về các hiện tượng, các vấn đề trong không gian, đi
đến tập hợp thành các thuộc tính của một hay nhiều lớp và phân tích được sự liên
quan giữa các dữ liệu ban đầu.
Trong ứng dụng của HTTĐL, các đặc điểm và thuộc tính về không gian là rất
phổ biến. Câu hỏi về thuộc tính (attribute query) có chứa đựng cả tích chất thông
tin về không gian. Ví dụ: Trong cơ sở dữ liệu của một hành phố, ở đó mỗi mảng
bản đồ đều có Code thuộc tính về sử dụng đất, một bảng thuộc tính đơn giản có
thể yêu cầu liệt kê toàn bộ các mảng của các loại hình sử dụng đất có trong bản đồ.
Bảng thuộc tính đó có thể tạo được mà không hề có sự tham khảo về các mảng
trên bản đồ. Vì không có thông tin không gian đòi hỏi trả lời cho câu hỏi này nên
bảng đó được xem như là bảng thuộc tính (attribute query). Trong ví dụ này, toàn
bộ bảng thuộc tính có các Code của sử dụng đất đã được xác định. Các thông tin
khác có thể được tạo nên ví dụ như số mảng đơn vị (parcel) của loại hình sử dụng
đất này, hoặc tổng diện tích của loại hình sử dụng đất này ở trong thành phố... Tất
nhiên những bài toán xử lý thông tin cho một lớp là cần thiết, song trong ứng
dụng, việc xử lý thông tin của nhiều lớp cũng là công việc rất quan trọng và đòi
hỏi nhiều công sức trong lập trình. Ví dụ gảii bài toán về 2 lớp không gian về tính
toán diện tích của các loại hình sử dụng đất theo các cấp độ dốc khác
nhau...Những bài toán đó đặt ra đối với nhiều nội dung ứng dụng khác nhau mà
những phần mềm chuyên tự động hóa bản đồ hay quản lý dữ liệu không đáp ứng
được. Tất nhiên do mục đích của HTTĐL là tập trung vào xử lý không gian, nên
một số chức năng của việc tự động hóa bản đồ hoặc tính toán thống kê chuyên đề
thì có thể HTTĐL không đáp ứng được.
II.2.Một số vấn đề cơ bản trong xử lý không gian
• Xử lý thông tin trong một lớp: giải quyết các vấn đề về thuộc tính các đơn
vị trong một lớp, đo đạc các giá trị, phân tích sự liên quan giữa các đơn vị trong
một lớp bản đồ. Ví dụ xác định tên, tính diện tích, chu vi của từng khoanh vi bản
đồ, xác định khoảng cách, tạo các vùng ảnh hưởng (buffer zone).
• Xử lý thông tin nhiều lớp: chồng xếp hai hoặc nhiều lớp thông tin cho
phép tạo ra nhiều đơn vị bản đồ mới trên cơ sở làm chi tiết hoá thông tin của từng
phần trong một đơn vị bản đồ. Ví dụ hai lớp thực vật và đất khi chồng xếp sẽ cho
bản đồ thực vật phân bố trên các loại đất khác nhau.
• Xử lý không gian: có thể có rất nhiều lớp thông tin mà xử lý không gian
cần phải tính toán được mối quan hệ giữa chúng.
• Phân tích các mẫu điểm: một số đối tượng tự nhiên hoặc hiện tượng tự
nhiên có sự phân bố bằng các điểm tập trung theo các quy luật nhất định. Ví dụ:
phân bố của các đồng cỏ, hệ thống các điểm bố sụt cactor, phân bố của các loài
động vật, thực vật quý hiếm... Trong xử lý không gian, sự phân bố về những điểm
đó cần được nhận diện và phân loại.
• Phân tích mạng: thiết lập một mạng hữu ích giữa các diện có sự phân bố
khác nhau là một trong những chức năng xử lý không gian: ví dụ tạo tuyến xe bus
gần nhất nối các điểm đón khách trong thành phố, mở một hệ thống đường nối
giữa các khu dân cư, thiết kế một tuyến đường ống dẫn dầu... Tất nhiên khi thiết
kế cụ thể lại phải bổ sung bằng một số thông tin khác nhau, ví dụ: địa hình, sử
dụng đất…
• Phân tích, xử lý theo ô lưới (grid analysis). Bài toán xử lý ô lưới rất
phong phú, nó có thể ứng dụng cho nhiều ngành: ví dụ tính toán lan truyền ô
nhiễm, lập các đường đẳng trị, dự báo cháy rừng…
• Phân tích xử lý nhiều lớp thông tin theo điều kiện. Đây là chức năng phức
tạp và đa dạng nhất của xử lý không gian. Nhiều bài toán được áp dụng để biến
đổi lớp thông tin ban đầu thành một hay nhiều lớp thông tin mới: ví dụ tính độ
dốc, hướng dốc, tính mật độ, bài toán boolean, bài toán logic, các phép phân chia,
tính căn... bản đồ, những lớp thông tin mới.
• Vùng bên trong là phần không bao gồm đường biên. Polygon là diện tích
có vùng bên trong, một đường viền bên ngoài, không có điểm giao cắt ở bên trong
và không có khoanh vi nào khác ở phía trong. Polygon phức tạp: là polygon có
một hoặc nhiều khoanh vi khác ở bên trong.
• Có hai khái niệm được sử dụng bổ sung cho định nghĩa trên đó là pixels
và ô lưới đơn vị (grid cells) Pixel là đơn vị hình ảnh có hai kích thước, nó là đơn
vị nhỏ nhất của hình ảnh không thể chia nhỏ được. Ô lưới đơn vị là đối tượng có
hai kích thước, thể hiện một yếu tố của một bề mặt có cấu trúc đều đặn bởi chúng.
Những khái niệm nêu ở trên là do bản đồ số của Mỹ đưa ra (National comitee
for digital colorgaphic data standars - NCDCDS). Các khái niệm đó có thể được
gọi khác đi,tùy theo sự thiết kế về tên gọi trong từng hệ thống phần mềm HTTĐL.
II.3.Các yếu tố cơ bản của thông tin không gian
Việc phân tích trật tự và tổ hợp không gian yêu cầu phải có ba thuộc tính cơ
bản sau: vị trí (location), dữ liệu thuộc tính (attribute data) và tính chất hình học
(topology).
• Vị trí: là tính chất quan trọng mà mỗi đối tượng không gian phải có. Vị trí
được xác định bởi tọa độ X và Y trên mặt phẳng ngang (caitesian).
• Dữ liệu thuộc tính: Cung cấp nhiều thông tin quan trọng về tính chát của
đối tượng được nghiên cứu. Ví dụ bản đồ có các đặc điểm thì bảng thuộc tính phải
nêu được tích chất các đặc điểm đó, ví dụ: giống cột điện hay hố nước... với các
thông tin cụ thể cho từng loại.
• Dữ liệu hình học: được định nghĩa là mối quan hệ không gian giữa các
yếu tố bản đồ. Trong trường hợp các polygon, có những polygon lại nằm trong
ranh giới của một polygon khác. Với các yếu tố đường có, những đường tạo nên
bởi hai đoạn thẳng (segment) nối với nhau trực tiếp hoặc nối gián tiếp qua một
đoạn thẳng thứ ba, hoặc hai đoạn thẳng hoàn toàn không nối với nhau. Với các
điểm, các điểm có thể ở cách nhau những khoảng cách khác nhau.
• Nhìn chung, vị trí và dữ liệu thuộc tính là tương đối dễ hiểu, song đặc
điểm hình học thì hơi khó hình dung hơn. Có một số khái niệm và thuộc tính như
sau:
• Tiếp giáp (adjacency): hai polygon ở liền nhau thì được gọi là tiếp giáp
với nhau. Khái niệm tiếp giáp được sử dụng khi phân tích sự liên quan của những
yếu tố ở liền kề nhau. Ví dụ: giá của một miếng đất sẽ cao hơn giá trung bình của
vùng nếu như vùng đất đó nằm liền kề với công viên hoặc khu thương mại...
• Chứa đựng (containment): biểu thị một yếu tố nào đó nằm trong rang giới
của một polygon. Mối quan hệ này cũng quan trọng khi phân tích mối liên quan
giữa hai kiểu đối tượng. Ví dụ: một mảnh đất nằm trong vùng ngập lụt có thể phải
mua bảo hiểm với giá cao hơn.
• Tiếp nối (connectivity): thể hiện cho hai đoạn thẳng được nối với nhau.
Khái niệm tiếp nối được xem xét cho việc phân tích giao thông, tuyến đi để có thể
tìm ra phương án mở tuyến tốt nhất.
• Giao nhau (intersection): được xem là một dạng phức tạp trong mối quan
hệ không gian của các yếu tố polygon. Giao cắt đối với polygon nghĩa là hai
polygon có cùng chung một vùng, vùng này có tính chất thuộc về cả hai polygon.
Khi xử lý chồng xếp bản đồ thì vùng giao nhau không cần xem xét đến các tính
chất hình học. Tuy nhiên thông dụng nhất là các vùng được bố trí tách biệt nhau
trong cơ sở dữ liệu.
Tóm lại, 3 yếu tố: vị trí, dữ liệu thuộc tính và đặc điểm của dữ liệu là rất
quan trọng trong xử lý không gian. Tự động hóa bản đồ sẽ giúp ích cho việc trình
bày và tổ chức dữ liệu không gian. Trong xử lý không gian, tổng hợp các đặc điểm
về mối liên hệ không gian giữa các yếu tố bản đồ được xử lý bởi HTTĐL và nó
cung cấp khả năng xử lý đồng thời cả ba yếu tố. Các đối tượng không gian được
trình bày dưới dạng đặc điểm về đường, điểm, hoặc polygon. Mỗi một đặc điểm
lại được thể hiện tập trung vào một số yêu cầu về mặt cơ sở dữ liệu.
II.4.Tổ chức dữ liệu không gian của HTTĐL
Trong một HTTĐL điển hình, các đối tượng không gian được liên kết để
nghiên cứu các hiện tượng thì nhất thiết phải được trình bày dưới dạng bản đồ với
mục đích thiết lập được mối liên quan không gian giữa chúng. Cả vị trí và thuộc
tính được xử lý thông qua một loạt các chương trình trong HTTĐL. Yêu cầu đầu
tiên để việc tạo lập dữ liệu một cách có hiệu quả là các đối tượng được thể hiện ở
ba yếu tố cơ bản là: điểm (point), đường (line) và vùng (area hay polygon). Theo
quan điểm của tổ chức quốc gia Mỹ về dữ liệu bản đồ số thì các yếu tố đó được
giải thích như sau.
Điểm: là đối tượng có kích thước bằng 0 về mặt hình học. Do đó các đối
tượng điểm chỉ dùng để xác định vị trí. Điểm không có ý nghĩa trong việc
đo về kích thước. Mặc dù trên bản đồ, các điểm được biểu thị bằng kích
thước khác nhau nhưng diện tích của các điểm là không có ý nghĩa thực
tế. Một số khái niệm về "điểm" như sau:
- Điểm thực tế (entity point): dùng để xác định vị trí của các đối tượng
dạng điểm như: các toà nhà, các cột. Trường hợp đó, xác định chính xác vị trí của
các điểm là điều rất quan trọng.
- Điểm chỉ tên (label point) được sử dụng để hiển thị một tập hợp chữ viết
cho các đối tượng bản đồ. Đối với những điểm nào thì độ chính xác của vị trí phụ
thuộc vào quan niệm bản đồ học. Nghĩa là vị trí các điểm chỉ tên cho các đối
tượng trên bản đồ được xác định sao cho không có sự lẫn lộn với nhau.
- Điểm có diện tích (area point) dùng để xã định một vị trí có thông tin về
diện tích. Ví dụ có thể dùng điểm để thể hiện vị trí một quốc gia và độ lớn của
điểm chứa đựng thông tin về đất nước đó.
- Điểm giao nhau (node) thể hiện vị trí một diện với các dấu hiệu về hình
học, ví dụ: nơi giao nhau hoặc điểm cuối của các yếu tố đường.
Các thông tin về điểm các một kích thước trong phân tích không gian mặc dù
chúng thể hiện cho các đối tượng có hai kích thước ở trên bản đồ. Ví dụ: một điểm
biểu thị cho 1 giếng, một điểm biểu thị cho một cột. Mặc dù diện tích mà giếng
chiếm khác với diện tích của cột chiếm. Trong một bản đồ thì không thể nêu được
diện tích mà giếng hoặc cột chiếm trên thực tế - do tỷ lệ bản đó không đáp ứng.
Trong phân tích không gian, diện tích giữa các điểm là không tính (trừ trường hợp
các điểm có diện tích, lúc đó điểm đã trở thành vùng)
• Tính chất của điểm: đây là dạng đơn giản nhất của các đối tượng không
gian.
Khi nói về dữ liệu điểm, phải nói đến số lượng điểm tối thiểu cho một cơ sở
dữ liệu điểm. Nhìn chung, các yếu tố tối thiểu cho một cơ sở dữ liệu điểm là
những thuộc tính về toạ độ,ngoài ra, các tính chất khác của điểm được mô tả trong
hàm sau:
Pi: ( X, Y, Z1 Z2 Z3 …Z.m)
Ở đây:
i là Code xác định của mõi điểm ( identification Code -ID)
X, Y toạ độ của đIểm, được xác định theo toạ độ phẳng (x, y trong mặt
phẳng cartesian)
Z 1,Z2… Z m các đặc trưng khác của điểm.
Vì điểm có kích thước bằng không (= 0) nên nó không có khoảng trống ở
giữa, song nó phải có thuộc tính về mặt hình học, đó là toạ độ. Thông tin về mối
liên quan giữa các điểmcó thể xác định bằng công thức toán học. Trong trường
hợp có nhiều điểm thì khoảng cach giữa các đIểm được xác định bởi vị trí của các
điểm đó với nhau.
Đường: đường là các yếu tố có một kích thước và thể hiện cả vị trí và
hướng. Độ dài là dấu hiệu đo đạc về kích thước của đối tượng đường.
Mặc dù các yếu tố đường thường có không gian hai kích thước trên bản
đồ nhưng độ rộng của đường là không được xem xét đến trong tính toán
hướng của bản đồ.
Tính chất của đường: Đường được hiểu là tập hợp của rất nhiều điểm. Mỗi
đường đều có thể chia thành nhiều đoạn thẳng và mmỗi đoạn được xác dịnh bởi
hai điểm ở hai đầu. Để cấu tạo nên yếu tố hình học của đưòng thì yếu tố cơ bản là
hướng của đường. Ngoài ra, còn một yếu tố khác, đó là sự tiếp nối giữa các đường.
Để hiểu sự tiếp nối đó, ta có thể hình dung tới một đoạn thẳng nối giữa một điểm
này với một điểm khác.
Như vậy, các yếu tố cơ bản của mỗi đường gồm có:
Lj: (P1, P2, …Pn, Z1, Z2…Zm, H1…Hq)
ở đây: j Code của đường ( ID)
P1 điểm thứ 1
Pn điểm thứ n
Z1 thuộc tính của đoạn thứ 1
Zn thuộc tính của đoạn thứ n
Hq - Code ID của đoạn thứ q được nối trong thứ tự của đường
(1… n) là hướng của đường từ 1 đến n của đường.
Vùng: (area) hoặc (polygone)
Vùng là khái niệm phức tạp nhất trong 3 loại yếu tố không gian của cấu trúc
vector. Vùng được hiểu là một diện tích giới hạn bởi một đường khép kín và
phần bên trong đó có những tính chất cụ thể.
Cáctính chất của polygon:Polygone dược xác định bởi một loạt các đường
vạch định ranh giới. Thêm vào đó, polygone là yếu tố có 2 kích thước . Mỗi
polygone được xác định bởi một diện tích nhất định. Vì polygone không có hình
dạng và kích thước nhất định, nên mối quan hệ không gian sẽ khó xác định nếu
không có những thuộc tính được làm rõ. Hai polygone có thể nằm tách biệt với
nhau, hoặc kề nhau, hoặc cái nọ nằm trong cái kia.
Trong trường hợp nằm tách biệt hẳn so với nhau thì lại có khả năng chúng
được nối với nhau bằng polygone thứ ba.
Yêu cầu về thuộctính của polygone bao gồm:
G. K (L 1…L n, Z1… Zm ú1…úr, ử1…ửs,ệ1… ệt)
ở đây: K là Code của polygone G, tần số kết nối của đường từ L1 đến Ln và nó
xác định ranh giới của polygone G.
Z n xác định giá trị của thuộc tính thứ n
ú1…úr thể hiện một hoặc nhiều polygone kết nối với nhau tạo nên
polygone K
ử1…ửs xác định có 1 hay nhiều polygone chứa trong polygone K
ệ1… ệt xác định có một hay nhiều polygone nằm trong polygone K
Các thông tin hình học bổ sung khác còn có thể là càn thiết đối với các
polygone phức tạp.nhiều thông tin hình học có thể được bổ sung ngay trong những
thông tin về đường hoặc được làm đơn giản hoá đi. Ví dụ: hai polygone nằm liền
kề thì phải có thêm thông tin về một đoạn thẳng chung ở giữa làm biên giới giữ
hai polygone.
II.5.CÁC MÔ HÌNH CẤU TRÚC CƠ SỞ DỮ LIỆU

II.5.1.Khái quát chung
Tư liệu (data) được hiểu như những sự hiện diện đã được kiểm tra về thế
giới thực (Graeme F Borinam Carter). Thông tin là tư liệu được tổ chức theo
những mẫu thể hiện nhằm dễ dàng tìm kiếm và khai thác.
Tư liệu không gian phải được trình bày và lưu trữ một cách riêng biệt trong
nưhngx không gian của HTTĐL. Ví dụ: đường, điểm, vùng, bề mặt … phải được
lưu trữ độc lập cùng các thuộc tính của chúng tạo thành những file dữ liệu không
gian hoặc phi không gian.
Cơ sở dữ liệu ( CSDL) là toàn bộ những thông tin cần thiết về đối tượng
được lưu giữ dưới dạng số. CSDL có thể là không gian hoặc phi không gian. Hệ
thống quản lý CSDL (Database management System - DBMS) là tập hợp một số
chức năng của phần mềm để lưu giữ, bổ sung và thể hiện dữ liệu . Các hệ thống
quản lý cơ sở dữ liệu phi không gian hoặc không gian thường tách biệt nhau. Cũng
có một số phần mềm tổ chức kết hợp để quản lý cả hai dạng dữ liệu hoặc cung cấp
khả năng liên kết với các phần mềm CSDL khác. Chương trình này sẽ tập trung
giới thiệu các cấu trúc dữ liệu chính là cấu trúc phân nhánh, chia nhỏ và cấu trúc
mạng. Ngoài ra, các dữ liệu thuộc tính phi không gian trong mối liên hệ với các
thuộc tính không gian cũng được đề cập đến. Cấu trúc dữ liệu không gian là sự tổ
chức tư liệu không gian dưới một khuôn dạng phù hợp với máy tính. Cấu trúc của
dữ liệu phải được tổ chức để có sự liên hệ giữa các mô hình dữ liệu và các khuôn
dạng (format) dữ liệu. Thực tế, giữa khái niệm mô hình và cấu trúc dữ liệu ít có sự
phân biệt. Tuy nhiên khái niệm mô hình được sử dụng ở phạm vi nguyên lý từ
khái quát đến cụ thể, còn cấu trúc là khái niệm mang tính chất kỹ thuật và minh
hoạ một cách hệ thống về bản chất và sự liên hệ giữa các thành phần của CSDL.
Cấu trúc của dữ liệu Raster được sử dụng rộng rãi trong hệ xử lý ảnh và xử
lý TTDL - raster, còn cấu trúc của dữ liệu vertor được sử dụng nhiều trong các hệ
CAD (Computer Aided Decizion - Máy tính thiết kế trợ giúp), hoặc trong HTTĐL
vertor với những khả năng mạnh về bản đồ. Trong thực tế áp dụng nhiều HTTD có
cả hai hệ thống cấu trúc dạng Raster và Vertor để có thể sử dụng một cách linh
hoạt và giao diện với nhau để đáp ứng cho những nhiệm vụ cần giải quyết. Những
sự giao diện đó được thể hiện cụ thể với việc xử lý một hệ thống dữ liệu mẫu điểm
là: có bảng thuộc tính về tính chất và toạ độ các điểm, có khả năng nội suy thuộc
tính mẫu thành các file Raster; có khả năng tạo file vertor và contour của các
trường thuộc tính đã được nội suy; có khả năng tạo các mặt phẳng hình học và các
mô hình không gian với dữ liệu Raster hoặc Vertor. Tuy nhiên do không phải là
những HTTĐL chuyên đề mà các HTTĐL tổng hợp thường có một số ưu thế và
những hạn chế nhất định.
II.5.2.Cấu trúc dữ liệu Raster
Raster được hiểu là ô hình vuông có kích thước nhất định gọi là cell hoặc
pixell (picture element), cấu trúc Raster là cấu trúc hình ảnh. Mỗi ô vuông có chứa
thông tin về một đối tượng hay một sự hợp phần của đối tượng. Vị trí của đối
tượng được xác định bởi vị trí của các ô vuong theo trật tự hàng và cột. Cấu trúc
dữ liệu Raster đơn giản nhất là cấu trúc dạng bảng, ở đó có chứa các thông tin về
toạ độ và thuộc tính phi không gian. Thông tin về vị trí được thể hiện ở toạ độ theo
hàng và cột, tính theo trật tự sắp xếp của dữ liệu. Trường hợp có nhiều tính chất
thì có thể gọi là thông tin nhiều chiều. Bảng thuộc tính hai chiều của đối tượng
được gọi là bảng một chiều hay còn gọi là bảng thuộc tính Raster mở rộng
(expanded Raster table). Cấu trúc Raster đầy đủ là cấu trúc có đầy đủ số lượng các
pixell sắp xếp theo những vị trí xác định. Cấu trúc Raster rất tiện lợicho việc áp
dụng các chức nằng xử lý không gian dựa trên nguyên tắc chồng xếp thông tin
nhiều lớp. Các đặc điểm không gian là có thông tin về địa lý, nghĩa là chúng có
thể được trình bày trên bất cứ một bản đồ nào của một hệ toạ độ đã biết. Cấu trúc
Raster yêu cầu mỗi một đặc điểm phải được trình bày thành dạng đơn vị hình ảnh
(picture elemarts pixel). Trong trường hợp này một bản đồ được phân chia thành
nhiều pixels, mỗi pixel có vị trí theo hàng và cột. Một điểm nhỏ nhất được trình
bày bởi một pixel đơn lẻ và nó chiếm một diện tích bằng kích thước của một pixel.
A B
6 6
5 5
4 4
3 3
2 2
1 1
0 0 1 2 3 4 5 6
1 2 3 4 5 6
Hình 3. Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B)
Một đường trong cấu trúc Raster là một loạt cácpixel nối với nhau và một
polygon là một đám (cluster) của các pixel có cùng một giá trị.
Sau đây là những ưu điểm cơ bản của cấu trúc Raster:
• Đơn giản và dễ tham khảo
• Việc chồng xếp các lớp bản đồ được thực hiện một cách thuận tiện đưa
đến kết quả.
• Đối với mô hình không gian, các đơn vị địa lý được xác định trong cấu
trúc Raster, bao gồm hình dạng và kích thước. Như vậy trong kết quả mối quan hệ
giữa các pixel là ổn định và dễ dàng vẽ ra được.
• Dễ thiết lập một bề mặt liên tục bằng phương pháp nội suy.
• Đa số các tư liệu không gian thường được ghi ở dạng Raster như ảnh vệ
tinh, ảnh máy bay chụp quét. Thông thường các tư liệu Raster đó dẽ dàng nhập
trực tiếp mà không cần một sự thay đổi nào.
Những nhược điểm của cấu trúc dữ liệu Raster:
• Tài liệu thường bị tình trạng quá tải, làm tốn nhiều phần của bộ nhớ trong
máy tính. Trong rất nhiều trường hợp, các yếu tố bản đồ không nhất thiết phải
được gắn thuộc tính (code hoá) thành các ô lưới đặc trưng. Trong cấu trúc dữ liệu
Raster, những vùng rất rộng lớn có đặc điểm giống nhau được tồn tại một cách
ngẫu nhiên với một giá trị nào đó và là tập hợp của rất nhiều ô lưới. Trong khi đó
khi thể hiện về độ dốc thì ở vùng có độ dốc tương đối giống nhau, cấu trúc raster
vẫn thể hiện sự khác nhau do kích thước của các pixel tạo nên đường gồ ghề.
• Mối quan hệ về hình học giữa các yếu tố không gian thì khó vẽvà khó
thiết lập được, ví dụ với hai bản đồ được xác định bằng hàng, cột thì mối liên hệ
hình học giữa các đặc điểm của hai bản đồ đó là rất khó xác định.
• Các bản đồ Raster thường thô và kém vẻ đẹp hơn so với bản đồ vẽ bằng
đường nét thanh của cấu trúc Vector. Trong bản đồ Raster, các yếu tố đường,
sông, … ranh giới thường được biểu hiện bằng các pixel nên có dạng răng cưa.
• Việc chuyển đổi các thuộc tính không gian của cấu trúc Raster thì dễ bị
nhiễu. Ví dụ một con đường khi quay đi một góc nào đó rồi quay lại đúng góc đó
nhưng nó có thể bị biến đổi so với hình dạng ban đầu.
• Đối với phân tích không gian, hạn chế nhất của cấu trúc Raster là độ
chính xác thường thấp so với mong muốn (ví dụ khi tính độ day của một đoạn
thẳng sai số thường lớn hơn so với đo trực tiếp). Đây là điều khó tránh khỏi vì kích
thước tính được liên quan đến kích thước của các pixel và vị trí của một đoạn
thẳng hay của một điểm cũng được xác định tuỳ thuộc kích thước của pixel.Đây
cũng là một điểm cần lưu ý trong khi thể hiện bản đồ dạng Raster ( hình 4 )
Hình 4. Mô phỏng cách thể hiện các khoanh vi theo cấu trúc Raster
II.5.3.Cấu trúc dữ liệu dạng Vector
Như phàn trên đã giới thiệu,trong cấu trúc dữ liệu dạng Vector, các đối tượng
không gianđược trình bày bằng một loạt các Vector. Trong khái niệm toán học,
một Vector được thể hiện bằng một điểm xuất phát (starting point) với toạ độ X và
Y đã cho, một hướng (direction) nghĩa là có một góc nào đó theo hướng đông, tây,
nam, bắc và một độ dài (length). Một điểm được thể hiện bởi một Vector bị thoái
hoá (degenerate) với cả hướng và độ dài của nó đều bằng 0. Trong trường hợp này
điểm cũng không có cả diện tích.
Một đường được thể hiện bởi sự lặp lại của các Vector, mà các Vector này là
các đoạn thẳng vì chiều rộng của các Vector cũng không được xác định nên về ý
nghĩa không gian, đường chỉ có một kích thước, đó là độ dài.
Một polygon được thể hiện bở một loạt các Vector tạo nên một vùng khép
kín và diện tích của vùng đó có thể đo được.
Hiình 5. cấu trúc dữ liệu vecter

Những ưu điểm của cấu trúc Vector:
• Ít trường hợp tư liệu bị đầy chặt bộ nhớ trong máy tính vì tổ chức dữ liệu
Vector thường ở dạng nén, vì có thể chứa được một lượng dữ liệu Vector rất lớn
trong tư liệu không gian.
• Các đối tượng riêng biệt được thể hiện một cách rõ ràng và liên tục bằng
những đường nét rõ ràng.
• Các yếu tố không gian về mặt hình học thì dễ dàng được xác định.
• Có độ chính xác cao trong việc tính toán và xử lý các yếu tố không gian.
Nhược điểm:
• Nhược điểm lớn nhất của cấu trúc dữ liệu Vector là xử lý chồng xếp các
lớp bản đồ rất khó thực hiện được, ngay cả những việc chồng xếp rất đơn giản của
dữ liệu Raster.
Ví dụ: Để xác định một điểm nằm trong một polygon không thì ở cấu trúc
Raster rất đơn giản khi biết vị trí của điểm theo hàng hay cột. Trong khi đó ở cấu
trúc Vector thì phải có một sự tính toán rất phức tạp.
- Hình bên trái dễ dàng xác định vị trí pixel B ở hàng 7 và cột số 8
hình bên phải các polygon A, B, C, D được xác định bởi một loạt các toạ độ
XY
A A A A A A A B B B
A A A A A A B B B B
A A A A A B B B B B A
B
A A A A B B B B B B
A A A B B B B B B B
A A C C C B B B B B
C C C C C D D B B B
C C C C C D D D D B C
C C C C C C D D D D D
C C C C C C D D D D
Raster Vector
Hình 6. So sánh giữa cấu trúc Raster và Vector

- Rất phức tạp. Để xác định một điểm có toạ độ 8,4 (theo toạ độ phẳng)
(tương ứng với điểm B ở hình bên trái có toạ độ hàng 7 cột 8) thì việc tính toán là rất
phức tạp mới xác định được điểm đó nằm ở polygon nào.
II.4.Mô hình cấu trúc dữ liệu cung và điểm nút (area-node)
Một mô hình dữ liệu là một cấu trúc cớ bản của dữ liệu được thiết kế để sao
cho việc khai thác và xử lý là thuận tiện nhất.
Mô hình cung và điểm nút (are-node) là môhình do cục thống kê của Mỹ
thiết kế theo các file dữ liệu địa lý từ năm 1980. Trên cơ sở mô hình này, các
đường phố và yếu tố dạng tuyến khác của nước Mỹ cũng được tổ chức theo hệ
thống file dữ dạng có hai thuộc tính độc lập về cung và điểm nối (dual
independence map encoding - DIME) (are-node Model- mô hình cung điểm nối).
Theo mô hình này, các cung tạo nên phần lớn các đơn vị cơ bản trên bản đồ. Khái
niệm về cung (area) ở đây khác với khái niệm về cung ở trong hội bản đồ của Mỹ
quy định. ở đây mỗi một cung bao gồm hai điểm nút: điểm đầu và điểm cuối. Giữa
các điểm nối và cung có thể không có hoặc có các giao điểm của các cung khác.
Hình dạng và độ dài của cung được xác định bởi vị trí của các điểm nối và các
giao điểm (vertice hoặc vertex). Một điểm nối khác với giao điểm về tính chất
hình học. Cụ thể: một điểm nối thì có toạ độ x và y và thuộc tính hình học, còn
giao điểm (vertex) thì chỉ có toạ độ x và y mà không có thuộc tính (hình 7)
35
Ghi chó
38 104
§iÓm nèi
102
102 Code cña polygon
36
37
101 35 Code cña cung
39
103
34
Hình 7. Cấu trúc một polygon đơn giản trong mô hình cung và điểm nối
Trên hình 3 có 4 polygon 101, 102, 103 và 104, các polygon được xác định
bởi 7 cung (are) từ 33-39. Mỗi cung có một điểm nối là điểm đầu và điểm cuối.
Những cung thẳng là không có giao điểm còn những cung gấp khúc là có một
hoặc nhiều giao điểm (vertex). Một điểm quan trọng cần lưu ý về mô hình cung -
điểm nối là một cung luôn được xác định bởi một điểm nối.
Hướng của một cung được hiểu một cách đặc biệt trong thứ tự của các điểm
nối, đó là điểm đầu và điểm cuối. Với một hướngđã biết thì hai phía (phải và trái)
của cung cũng được xác định. Những thông tin về một cung bao gồm:
Thuộc tính (ID) của cung
Thuộc tính (ID) của điểm nối đầu
Thuộc tính (ID) của điểm nối cuối
Thuộc tính (ID) của polygon bên trái của cung
Toạ độ x, y của điểm nối đầu
Toạ độ x, y của điểm nối cuối
Toạ độ của tất cả giao điểm
Ngoài ra trường (field) bao gồm độ dài của một cung cũng được xác định.
Điểm nối có ý nghĩa về mặt hình học là nó thể hiện sự tiếp nối giữa hai yếu
tố mô hình cung - điểm nối (area-node), một điểm được thể hiện bằng một yếu tố
đường bị thiếu hụt (degenerate) với điểm nối đầu trùng lên điểm nối cuối và không
có điểm giao cắt ở giữa.
Như vậy, một điểm được thể hiện bằng một điểm nối (node) vì điểm nối đầu
và điểm nối cuối là giống nhau. Đối với polygon như đã nêu ở trên thì mỗi
polygon là bao gồm tập hợp các cung và điểm nối. Để xác định mối quan hệ
không gian của polygon thì mọi điểm giao cắt phải được xácđịnh bằng một điểm
nối.
Ưu thế cơ bản của mô hình cung cầu - điểm nối là luôn có thuộc tính không
gian và như vậy mức độ chính xác sẽ rất cao, đồng thời dễ xác định được mối
quan hệ không gian của các yếu tố. Ví dụ sự tiếp giáp của hai polygon hay
pplygon này nằm trong polygon kia và cách đơn giản là xem ở bảng thống kê các
cung mà chúng ta tạo nên 2 polygon đó. Trong bảng thống kê nếu có một cung nào
đó là một phần của cả hai polygon thì 2 polygon đó là nằm liền kề nhau.
Phần mềm ERIS ARC/INFO là phần mềm điển hình có tổ chức vector theo
mô hình cung- điểm nối và nó tự động tính và thống kê các thuộc tính của cung,
điểm nối, từ đó dễ dàng cho việc tính toán và xử lý các mô hình không gian.
Trong ARC/INFO, có hai dạng bảng thống kêlà bảng thống kê thuộc tính của
các polygon (polygon attribute table - PAT) và bảng thống kê thuộc tính của các
cung are attribute table – AAT.
Bảng 1. bảng thuộc tính của polygon PAT
# - ID N0 Poly – ID Thuộc Perimeter Area
Thuộc tính tính polygon Chu vi Diện tích
1 0 8418 4,506
2 104 8596 2,078
3 102 4296 1,144
4 101 2233 0,301
5 103 4325 0,983
Bảng 2. Bảng thống kê thuộc tính của cung AAT
# - ID Area- ID F-node T- node I- Poly. P P-Poly. P Length
Thứ tự Thuộc điểm điểm bên trái bên phải độ dài
tính cung đầu cuối
1 38 3 1 2 1,1 51
2 33 4 3 5 1,0 40
3 35 4 1 3 2,1 50
4 37 2 2 4 2,2 33
5 36 1 5 2 4,1 20
6 39 5 3 2 1,0 93
7 34 4 5 1 2,1 93
Trên bảng PAT, mọi tính chất chi tiết của polygon đều được tính và thống
kê, các chi tiết đó gọi là coverage.
Polygon thứ nhất (#-ID: 1)được gọi là polygone tổng hợp (universe
polygone), nó thể hiện một vùng tổng hợp tất cả các polygon có bên trong và có
diện tích được quy định là âm và có giá ttrị tuyệt đối bằng tổng diện tích của các
polygon bên trong. Các polygon tiếp theo được gắn các thuộc tính và các giá trị:
chu vi, diện tích mà được tính tự động khi các tính chất chi tiết được thiết lập.
Bảng AAT mỗi cung được xác định bởi cả số thứ tự và thuộc tính của cung,
thuộc tính của điểm đầu, điểm cuối và thuộc tính của các polygone ở bên phải, bên
trái của cung. Và các polygon này cũng chính là các polygone ở trong bảng PAT.
Ví dụ: polygone số 3 trong bảng AAT có số thứ tự là 3 và thuộc tính là 102 t0
bảng PAT.
Cả 3 yếu tố quan trọng của vector về tính chất hình học (topology) là tính
chất nối tiếp (adracency), tính chất chứa đựng (containment) và tính chất nối
(conectivity) là những yếu tố rất quan trọng và là vấn đề cốt lõi của mô hình cung
- điểm nối (are - node). Các yếu tố này sẽ giúp người phân tích xác định rõ được
tính chất của các yếu tố trong bản đồ.
Ví dụ: để xác định hai polygon có tiếp giáp nhau hay không, người phân tích
chỉ cần xem các cung xác định nên hai polygon đó, nếu có một cung nào cùng tính
chất thì nó chính là vị trí tiếp giáp của hai polygon. Trong bảng TAB, hai polygon
có số 102 và 103 được tiếp giáp nhau bởi cung số 33 trong bảng AAT.
Để xác định tính chất chứa đựng, cách xác định cũng như vậy. Muốn xác
định polygon A được chứa bởi polygon B hay không thì trước hết phải xác định
các cung tạo nên polygon A và thuộc tính của cả hai bên các cung, nếu như xác
định thấy A luôn ở mọi phía của cung thì A nhất thiết phải được chứa trong B. Ví
dụ cung số 37 trong hình 3 xác định nên polygon số 101, một phía của cung luôn
là polygon số 104 thì nhất thiết polygon số 101 phải được chứa trong polygon số
104. Trong trường hợp một polygon lớn chứa nhiều polygon nhỏ bên trong cũng
xác định một cách tương tự.
Tính chất tiếp nối của một cung được xác định từ thuộc tính của điểm đầu (F)
và điểm cuối (T) trong bảng AAT. Hai cung được xem là nối trực tiếp một khi có
chung điểm nối. Ví dụ trong bảng, cung 33, 38 và 39 là có chung một điểm nối số
3.F. Trong khi đó cung số 37 là không được nối với một điểm nào cả vì nó chỉ có
một điểm nối riêng của nó (số 2) tạo nên polygon thứ 4 có thuộc tính là 101.
Ví dụ trên là ví dụ cho một sự ưu điểm của mô hình cung - điểm nối, nó xác
định mối liên hệ hình học của các yếu tố và điều rất quan trọng trong xử lý không
gian. Mặt khác, vị trí (toạ độ x, y) của mỗi một điểm nối, điểm giao cắt cũng được
xác định. các thuộc tính đó cũng được thống kê rõ ràng trong bảng PAT và AAT
giúp cho người phân tích dễ dàng xử lý các thông tin. Trong thực tế, các tư liệu
không gian là rất phức tạp, mô hình are-node là công cụ hữu hiệu cho việc xử lý.
Hiện nay các phần mềm ERSI-ARC/INF và INTERGRAPH được xây dựng theo
mô hình này, Trong khi đó, phần mềm MAP/ INFO không được xây dựng theo mô
hình cung-điểm nên giao diện giữa chúng không tương thích.
Tóm lại: nội dung phần này nhằm giới thiệu tập trung vào tư liệu không gian,
đó là cơ sở cho việc xử lý HTTĐL. Công việc thống kê thuần tuý thì không cần
phải có các dữ liệu không gian, sự phân tích không gian thì lại rất cấn các thông số
đó, đặc biệt là các thông số về địa lý và bản đồ.
Các đối tượng không gian có thể được trình bày dưới các dạng khac nhau là
đường, điểm và polygon. Các yếu tố cơ bản của chúng cần được xác định đó là vị
trí, thuộc tính và tính chất hình học.
Việc tổ chức các yếu tố này ở hai dạng cấu trúc Raster và polygon là khác
nhau. Nhìn chung vị trí và thuộc tính thì được tổ chức tương đối giống nhau
trongcả hai dạng cấu trúc dữ liệu, song tính chất không gian thì hết sức khác nhau.
Trong xử lý không gian, các thông tin quan trọng nhất về hình học và tính
chất tiếp giáp, chứa đựng và nối tiếp, cấu trúc Raster có hạn chế cơ bản là không
thể hiện được mối quan hệ không gian. Thay vào đó, cấu trúc Vector và đặc biệt là
cấu trúc cung- điểm nối có ưu điểm là cung cấp đầy đủ các thông tin thuộc tính
của điểm, đường và vùng nên nó giúp cho việc xử lý không gian được rõ ràng và
hiệu quả.
II.5.Mô hình mạng (network model)
Trong mô hình mạng , các cung trở thành mạng được thể hiện trong mạng
giao thông (đường sắt, đường bộ, đường không), mạng lưới điện , mạng thông tin
, mạng ống gas, ống nước. Các điểm nối trở thành các điểm nối, điểm dừng hoặc
điểm giữa của mạng giống như hệ thống chạc 3 hoặc hệ thống van một cổng dẫn.
Các điểm đó là nơi để dừng hoặc tiêp nhận các đối tượng hoặc đưa ra các đối
tượng cần lưu thông , tương tự các điểm dừng xe, bến đổ, nơi chuyển tải.. Trung
tâm của mạng là nơi chuyển tải nguồn cung cấp hoặc là nơi có những hoạt động có
tính chất cung ứng cho mạng như: siêu thị, bệnh viện, sân bay, trường học… ở qui
mô lớn hơn trung tâm có thể là cả một thành phố cung cấp , chuyển tải cho cả một
vùng rộng lớn. Như vậy điểm liên hệ trong mạng là những đầu mối và các đường
dẫn và mối liên hệ đó có hướng nhất định theo các điểm quay - đổi chiều. Tóm lại
những tính chất như đường nối , điểm nối , các điểm dừng , các trung tâm và các
điểm quay là những thông tin thuộc tính của mô hình mạng cơ sở dữ liệu vector.
Còn một tính chất khác của mạng là sự cản trở (tương tự điện trở của mạch điện).
Sự cản trở bởi khối lượng thông tin được truyền và thời gian truyền tải. Sự cản trở
có liên quan đến nhiều yếu tố của mạng, đồng thời có liên quan đến cả năng lượng
truyền. Trong mạng của HTTDL với dữ liệu vector , những yếu tố quan trọng ảnh
hưởng đến sự liên kết trong mạng đó là yếu tố hình học và sự nối tiép. Ngoài ra
các thuộc tính khác của đối tượng cũng phải được bố trí hợp lý cho từng mạng.
II.7.Chuyển đổi khuôn dạng dữ liệu

Trong xử lý HTTĐL, ngoài việc chuyển đổi khuôn dạng dữ liệu (format) với
các phần mềm khác thì một trong những chức năng quan trọng cần thiết là chuyển
đổi từ vector sang Raster và ngược lại. Chức năng này cho phép sử dụng một cách
linh hoạt những lớp thông tin có sẵn trong CSDL hoặc các lớp thông tin mới tạo
nên để đưa vào xử lý nhanh chóng trong hệ thống.
Chuyển đổi dữ liệu thanhf Raster (Raster hoá) (Rasterisation hay
Rasterising) là quá trình chuyển đổi dữ liệu từ cơ sở pixel sang dạng vector. Công
việc này rất cần thiết cho nhiều mục đích, Khi mà các đường contour của vector
cần thiết được xử lý phối hợp với tài liệu Raster.
Để Raster hoá cần thiết phải tạo lưới với độ phân giải (kích thước pixel)
thích hợp lên toàn bộ bản đồ và tính gia trị pixel bằng việc lựa chọn các vùng mẫu
tại nơi giao nhau của các đường vector hoặc nơi tiếp giáp của các polygon, từ đó
gắn giá trị các pixel tại nơi tiếp giáp, sao cho nó phân biệt hẳn với các pixel ở
xung quanh. Nếu vector hoá với độ phân giải thấp thì sẽ làm giảm độ chính xác
của bản đồ đôi khi làm rối các đường contour.
Nguyên nhân của việc làm rối, sai lệch các đường là do lựa chọn độ phân
giải không thích hợp hoặc chọn vùng mẫu của lưới chưa đúng vị trí. Tuy nhiên,
trong thực tế áp dụng các chức năng này đã có sẵn trong các phần mềm nên khi áp
dụng người sử dụng ít phải can thiệp và khi cần thiết thì thao tác; quan trọng là xác
định độ phân giải và vị trí các ô lưới.
Chuyển dữ liệu Raster thành vector (vector hoá) có nhiều phương pháp
vector hoá. Công việc này chỉ thực hiện một khi tài liệu gốc có ở dạng Raster (ví
dụ như ảnh vệ tinh hoặc các bản đồ nội suy) trong quá trình phân tích lại đòi hỏi ở
dạng vector. Vector hoá chỉ thực hiện được một khi chiều rộng của dải pixel được
xác định và có đường nối giữa các pixel đó với nhau. Vector hoá là một quá trình
xử lý tỉ mỉ, nó đòi hỏi phải có sự xem xét và điều khiển quá trình xử lý, đặc biệt là
ở những chổ tiếp nối. Trong quá trình hai việc phải làm là: tẩy sạch rìa của các đối
tượng có chức năng tạo nên đường biên giới. Kết quả là các đối tượng này trông
sắc nét dạng răng cưa vuông. Quá trình tẩy rửa được thực hiện theo chiều kim
đồng hồ. Quá trình tẩy cũng cho phép bổ sung các toạ độ của các pixel một cách
rõ ràng để phục vụ cho việc định vị các đường vector được lập.
Hình 8. chuyển đổi Raster và véctơ

Nối các pixel bằng đường chạy qua chúng. Đây là quá trình xử lý đơn giản
giống như việc số hoá. Quá trình này được thực hiện lần lượt, khi gặp vị trí có sự
chuyển thành nhiều hướng thì đó là các điểm. Quá trình này có sự can thiệp của
người điều hành thì kết quả sẽ tốt hơn. Cũng cần lưu ý rằng chức năng vector hoá
chỉ nên áp dụng một khi cần thiết.
Tóm lại, những phần trên này đã tập trung giới thiệu để cung cấp một cách
nhìn rõ ràng về vấn đề cơ sở dữ liệu hình thành trong máy tính. Chúng ta cũng đã
nêu khái quát những đặc điểm của hai dạng dữ liệu cơ bản là Raster và vector,
đồng thời cũng giới thiệu về hai khái niệm quan trọng khác của HTTĐL là mạng
và các bề mặt.
Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các
phương pháp nén dữ liệu .Có một số khái niệm nén số liệu phổ biến như sau
- Mã hoá chạy theo dòng ( run lengh code)
- Mã hoá theo chuỗi mắt xích ( chain codes)
- Mã hoá theo khối ( bloch codes )
- Mã hoá theo cách chia thành 4 ô nhỏ (quadtrees )
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster. Tuy nhiên
dù sao khái niệm độ chính xác của các đối tượng trong HTTĐL vẫn chỉ là tương
đối. Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng
tư liệu là điều cần thiết và là tất nhiên
Tóm tắt chung
Phần này đã tập trung giới thiệu để cung cấp một cách nhìn rõ ràng về vấn
đề cơ sở dữ liệu hình thành trong máy tính. Trong đó, đã nêu khái quát những đặc
điểm của hai dạng dữ liệu cơ bản là Raster và vector .Do dữ liệu Raster thường
chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster, tuy nhiên dù
sao khái niệm độ chính xác của các đối tượng trong HTTDL vẫn chỉ là tương đối.
Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng tư
liệu là điều cần thiết và là tất nhiên.Thông thường , các mô hình xử lý tư liệu
thường là không gian hai chiều hoặc 3 chiều. Trong tương lai, để theo dỏi diễn
biến của các đối tượng thì phải xử lý theo đa thời gian và dự báo - đó là khái niệm
về chiều không gian thứ 4 của mô hình xử lý HTTDL.
III.TÍNH CHẤT ĐỊNH LƯỢNG CỦA PHÂN TÍCH KHÔNG GIAN

Ba yếu tố của thông tin không gian là: vị trí, thuộc tính và tính chất hình học
có những vai trò khác nhau trong phân tích không gian. Thông thường, những
nghiên cứu đầu tiên là tập trung vào các thuộc tính của dữ liệu. Về sau, hướng cần
nghiên cứu là thiết lập mô hình để giải thích sự phân bố của các hiện tượng hoặc
các yếu tố tự nhiên trong mối quan hệ không gian nghĩa là phải xác định mối quan
hệ về vị trí và thuộc tính của chúng.
Mỗi một yếu tố không gian đều chiếm một vị trí nhất định trên bề mặt trái
đầt. Vì vậy muốn thể hiện một đối tượng nào đó lên bản đồ, nhất thiết phải được
đặt trong một hệ thống toạ độ qui định. Độ chính xác của vị trí tuỳ thuộc vào hệ
thống toạ độ sử dụng và phương thức tổ chức của các đối tượng lên bản đồ. Bên
canh đó, việc xử lý không gian thường có tham khảo, sử dụng nhiều nguồn tư liệu
với các hệ thống toạ độ khác nhau, vì vậy độ chính xác của xử lý còn tuỳ thuộc
vào khả năng chuyển đổi giữa các hệ thống toạ độ đó.
Một số yêu cầu cơ bản về định lượng của việc phân tích không gian
Hệ thống toạ độ sử dụng phải tiện lợi cho quá trình tổ chức dữ liệu và xử lý
HTTĐL. Khi xử lý nhiều nguồn dữ liệu với các hệ toạ độ khác nhau thì hệ thống
phần mềm phải có khả năng chuyển đổi toạ độ một cách đa dạng.
Vì HTTĐL thường sử dụng nhiều nguồn tư liệu ở các hệ thống toạ độ khác
nhau, phần mềm phải có khả năng thiết lập và chuyển đổi toạ độ vào hệ thống
thường được sử dụng. HTTĐL phải cho phép những người sử dụng khác nhau có
thể chuyển đổi toạ độ của dữ liệu nguồn về một hệ thống toạ độ chuyên để được
sử dụng với từng chuyên ngành, khi đó phải có các hàm toán chuyển đổi tọa độ.
Việc đo đạc vị trí là bước đầu tiên của xử lý không gian và điều cốt yếu là
phải thể hiện được vị trí của bất kỳ một đối tượng nào trong hệ thống toạ độ sử
dụng sử dụng xác định hệ thống tọa độ là hết sức quan trọng vì nó giúp cho việc
xác định tính chất và các thuộc tính về vị trí của dữ liệu.
Một trong những hệ thống toạ độ rất quan trọng cho việc xử lý không gian
cũng như cho việc vẽ bản đồ là toạ độ lưới (grid system) và hệ thống này được
chấp nhận một cách rộng rãi và có giá trị tham khảo cho toàn bộ các hệ toạ độ
khác. Ngoài ra còn sử dụng hệ toạ dộ UTM (Universal Transverse Mercator
projection).
III.1.hệ thống của toạ độ lưới-hay tọa độ địa lý
III.1.1. Toạ độ địa lý
Trong hệ thống toạ độ lưới, vị trí của một nơi trên bề mặt trái đất được xác
định vào khoảng cách đến xích đạo và đường kinh tuyến chính. Phương Bắc địa lý
(cực Bắc) được xác định là điểm cuối phía Bắc của trục quay trái đất và tương tự
như vậy điểm Nam là điểm cuối trục quay trái đất. Xích đạo là nơi tập hợp các
điểm tạo nên. là cơ sở để đo vị trí của các điểm ở hai hướng Đông và Tây. Nửa
bán cầu phía đông của kinh tuyến chính, còn phần Tây bán cầu là ở phía Tây. Kinh
độ của một điểm bất kỳ được đo bởi khoảng cách góc giữa xích đạo và điểm thứ
hai tương ứng có cùng vĩ độ và nằm ở kinh tuyến chính.
Cùc B¾c (N) 0
0
180
60 (N)
0
135
0
60
§«ng
0
135
XÝch ®¹o 70
0
70
0
T©y
0 Kinh tuyÕn chÝnh
0
Cùc Nam (S)
Hình 9. các đường kinh tuyến, vĩ tuyến trong hệ toạ độ lưới

Việc xác định hướng Đông hay Tây tuỳ thuộc vào vị trí điểm nằm ở bán cầu
nào. Vì kinh độ và vĩ độ được xác định trên cơ sở của hệ thống lưới và việc đo đạc
được thực hiện trên hình cầu thay vì đo trên mặt phẳng. Như vậy, mỗi một ô được
xác định bỏi một cặp kinh tuyến và một cặp vĩ tuyến với một bề mặt cong. Toạ độ
dựa trên kinh độ và vĩ độ phải được chuyển đổi về một lưới chiếu bản đồ. Tóm lại
lưới địa lý là lưới được chiều từ dạng mặt cầu lên một mặt phẳng để tạo lập nên
bản đồ. Dưới dây là hai mối liên hệ quan trọng về mối quan hệ không gian của
kinh độ và vĩ độ.
Khoảng cách 1o của vĩ độ được xem là hằng số mặc dù trong thực tế khoảng
cách đó là khác nhau tuỳ thuộc vào vĩ độ. Trong khi đó khoảng cách 1o của kinh
độ là khác nhau khi ở các vĩ tuyến khác nhau.
Khoảng cách 1o kinh độ là khác nhau so với khoảng cách 1o vĩ độ và khác
nhau giữa hai điểm nằm cách nhau mặc dù ở trên cùng kinh tuyến. Do có sự không
nhất quán trong việc đó giữa kinh độ và vĩ độ mà việc đo khoảng cách dựa theo
kinh độ và vĩ độ không áp dụng chung được trong xử lý không gian.
Hệ thống lưới địa lý thường được dùng để tham khảo chung về vĩ trí trên bề
mặt trái đấi: vì hệ thống này xác định ví trí trên bề mặt cầu hơn là trên bề mặt
phẳng và một đặc điểm chính của hệ thống là sự khác biệt với việc thể hiển một vị
trí với hai chiều. Do đó trong việc áp dụng chính xác thì vị trí phải được chuyển
đổi về hệ thống toạ độ phẳng hai chiều. Ba vấn đề quan trọng trong việc thể hiện
một hệ thống toạ độ là xác định hướng bản đồ, tỉ lệ bản đồ và lưới chiếu bản đồ.
III.1.2.Định hướng bản đồ
Khi đã xác định hệ thống toạ độ, công việc đầu tiên là định hướng bản đồ.
Thông thường chỉ thị định hướng cho bản đồ là mũi tên chỉ hướng bắc. Đối với
bản đồ địa chất của Mỹ, thông thường có 3 hướng Bắc. Hướng Bắc thực (đúng),
hướng Bắc tư tưởng và hướng Bắc của lưới. Hướng Bắc thực là chỉ đúng về hướng
cực Bắc của Trái đất. Hướng Bắc tư tưởng là xác định theo kim của nam châm.
Hướng Bắc của lưới là đường thẳng đứng chỉ tới điểm cuối cùng của lưới chiếu ô
(Grid). Thông thường, trục thẳng đứng của một hệ thống toạ độ chính là cùng với
hướng Bắc của lưới. Vì vậy, hướng Bắc của lưới có thể khác nhau tại từng phần
của Trái đất, nên đối với một hệ toạ độ khác thì cần hiểu rằng đó chỉ là hướng Bắc
của hệ toạ độ mà thôi.
Tỉ lệ bản đồ: tỉ lệ bản đồ được xác định bằng tỉ số giữa một đơn vị độ dài trên
bản đồ với khoảng cách thực, tương ứng trên thực tế bản đồ có thể xác định theo 3
cách: bằng lới thuyết minh, bằng toán học hoặc bằng biểu đồ.
• Xác định bằng lời ,ví dụ : 1 cm bản đồ tương ứng với 1000m thực tế hay 1
cm = 1000m
• Thể hiện bằng toán học ví dụ : tỉ lệ 1: 100 000 hay 1/100 000 nghĩa là 1 cm
bản đồ tương ứng với 100 000 cm ngoài thực địa hay 1000 m
• Thể hiện bằng đồ thị: đồ thị được biểu thị bằng một đoạn ngắn với một
giá trị lớn, trong đó ta chia nhỏ thành từng đoạn ngắn với chữ số bên dưới. Một
bản đồ tỉ lệ lớn tuỳ chiếm một diện tích nhỏ trong thực tế song mức độ chi tiết sẽ
lại cao hơn so với bản đồ tỉ lệ nhỏ, nên khi xây dựng thước tỉ lệ ở bản đồ tỉ lệ phải
lớn hơn so với bản đồ tỉ lệ nhỏ để thể hiện được nhiều chi tiết hơn.
Một số điểm chú ý
• Trong xử lý không gian, ba cách thể hiện nói trên về tỉ lệ bản đồ là rất
quan trọng.
• Tỉ lệ bản đồ xác định mức độ chính xác về vị trí của tư liệu. Mức độ
chính xác đó liên quan đến một loạt yếu tố khác như: độ chính xác của phần cứng
của máy tính hay độ phân giải của các thiết bị nhập và xuất dữ liệu (nghĩa là độ
phân giải của bàn số và máy in), độ chính xác của bản đồ nguồn, thiết kế của cơ sơ
dữ liệu, độ phân giải của phần mềm (nghĩa là sự xác định về sai khác trong khái
niệm, số nguyên hay điểm thị sai (floating point) hoặc mức độ chính xác của điểm
thị sai là bậc 1 và 2.
Cùc B¾c
Kinh tuyÕn
XÝch ®¹o
VÜ tuyÕn
Cùc Nam
Hình 10. Các yếu tố chính của trái đất

Vĩ tuyến là những vùng tròn bất kỳ trên bề mặt trái đất và song song với xích
đạo. Như vậy số lượng vĩ tuyến là vô cùng mà mỗi điểm trên mặt đất đều rơi chính
xác vào một điểm đó. Kinh tuyến là một vùng tròn tưởng tượng trên bề mặt trái
đất và chia đôi quả đất thành hai phần bằng nhau và nó chạy qua cả cực Bắc và
cực Nam của Trái đất. Như vậy số lượng kinh tuyến là vô cùng nhiều. Kinh tuyến
và vĩ tuyến luôn vuông góc với nhau và góc giao của chúng luôn là 90o. Kinh
tuyến chính được quy định một cách ngẫu nhiên là kinh tuyến đi qua đài quan trắc
thiên văn Greenwich ở Anh.
Xích đạo được sử dụng như một đường vĩ tuyến cơ sở để xác định hai hướng
Bắc và Nam và nó có giá trị là 0o. Vĩ độ của một điểm bất kỳ được đo bằng khoảng
cách góc (angular distance) giữa điểm đó và xích đạo và nó xác định cho một góc
giữa đường thẳng nối từ điểm đó tới tâm Trái đất và đường thẳng từ tâm Trái đất
đến một điểm có cùng kinh độ và năm trên đường xích đạo. Như vậy một điểm
nằm trên bán cầu phía Bắc mà có vĩ độ là 900 thì chính là điểm cực Bắc. Tương tự
như vậy ở Nam bán cầu là điểm cực Nam của Trái đất. Kinh tuyến có giá trị 0
được sử dụng và những vấn đề khác. Tất cả sẽ trở nên bằng nhau khi mà độ chính
xác về tư liệu vị trí là một hàm của tỉ lệ bản đồ. Nhìn chung, các bản đồ tỉ lệ lớn
hơn thường có độ chính xác lớn hơn.
Tỉ lện bản đồ ảnh hưởng tới sự đo đạc của việc thống kê không gian do đó
phải phân tích kỹ các kết quả thống kê.
Mặc dù tỉ lệ bản đồ thể hiện cho một bản đồ tiêu chuẩn, song trong thực tế
thì tỉ lệ bản đồ lại khác nhau tuỳ thuộc vào vị trí của nó ỏ trong lưới chiếu. Ví dụ
khoảng cách của hai điểm ở gần cực thì khác với khoảng cách của hai điểm đó nếu
nó thuộc về vĩ độ cao hơn mặc dù trong bản đồ thì khoảng cách đó được thể hiện
gần bằng nhau. Sự sai lệch đó sẽ ảnh hưởng nhiều khi thực hiện ở bản đồ tỉ lệ lớn,
do vậy không thể sử dụng những dấu hiệu phân tích ở bản đồ nhỏ áp dụng cho bản
đồ tỉ lệ lớn, do vậy không thể sử dụng nhưng dấu hiệu phân tích ở bản đồ nhỏ áp
dụng cho bản đồ tỉ lệ lớn. Trong thực tế, để phân tích không gian cho nghiên cứu
địa hình ở tỉ lệ nhỏ với một vùng rộng lớn thì những sai lệch của việc đo đạc có
thể rất lớn và cần phải được cân nhắc khi xử lý
III.1.3.Các lưới chiếu bản đồ
Các phân tích không gian yêu cầu có sự chuyển đổi các đặc điểm trên bề mặt
cầu của Trái đất thành hệ thống toạ độ hai chiều. Phép chiếu bản đồ cung cấp khả
năng chuyển tư liệu vị trí từ mặt cầu sang bề mặt phát triển. Developed Surface và
một bề mặt phát triển đó có thể được trình bày thành một bề mặt phẳng hoàn toàn.
Mặc dù nều mặt cầu được chia thành rất nhiều mẩu nhỏ thì mỗi mảnh vẫn còn lưu
giữ được phần cong của mặt cầu nguyên thuỷ. Do đó, nhiệm vụ của bản đồ học là
chuyển đổi một cách hệ thống tài liệu vị trí từ mặt cầu sàng bề mặt phát triển.
Rất nhiều lưới chiếu bản đồ có khả năng đó, nhưng tất cả đều bị sai lệch ở
một trong các yếu tố: hình dạng, diện tích, khoảng cách và hướng. Một lưới chiếu
bản đồ tối ưu đối với một phép chiếu nào đó thì phụ thuộc vào việc có độ chính
xác cần thiết và kích thước của vùng nghiên cứu (bản đồ). Ngoài ra còn một số
yếu tố khác. Mỗi lưới chiếu có một quá trình chuyển đổi riêng và có những đặc
điểm riêng. Có 4 phương pháp chiếu cơ bản là chiếu theo phương vị (azimuthal),
chiếu hình trụ (cylindrical), chiếu hình nón và chiếu hình trụ giả (Psedu-
cylindrical).
Lưới chiếu phương vị: có đặc điểm là sử dụng một nguốn sáng từ trung tâm
hình cầu chiếu vào các đường kinh vĩ tuyến thì hình chiếu của kinh vĩ tuyến lên
mặt phẳng nằm ngang vuông góc sẽ là lưới chiếu phương vị thông thường, hình
chiếu đó là những vòng tròn đồgn tâm và các đường kính giao nhau tại tâm, nguồn
sáng có thể là khác nhau tạo nên các lưới khác nhau và nếu khoảng cách nguồn
sáng là xa vô cực thì lưới chiếu Bắc bán cầu và Nam bán cầu lên bề mặt tiếp tuyến
là trùng nhau, khí đó gọi là "lưới chiếu phương vị tập thể" (Stereo graphic
Projection).
Hình 11. Lưới chiếu phương vị
Hệ chiếu hình lăng trụ: là lưới chiếu để chuyển các đường kinh vĩ tuyến từ
mặt cầu lên bề mặt một hình trụ đứng, hình trụ này phủ lên hình cầu với vùng tròn
tiếp tuyến hoặc cắt qua hình cầu bởi những vòng tròn đồng tâm. Khi phát triển bề
mặt hình trụ này thành mặt phẳng thì tạo nên một hệ toạ độ có 2 kích thước, khí đó
bề mặt hình trụ chuyển thành hình chữ nhât.
Hình 12.Lưới chiếu hình trụ triển khai thành mặt phẳng với các ô hình chữ nhật
Hệ chiếu hình nón là hệ chiếu che phủ lên hình cầu hoặc cắt qua nó bởi một
hình tháp nón chuyển thành dạng hình nón cụt (hình 13).
Hình 13. Triển khai của lưới chiếu hình trụ

Hệ lưới chiếu UTM (Universal Transverse Mecator) của Mỹ là sử dụng hệ
lưới chiếu hình nón. Ngoài ra còn một hệ lưới chiếu khác gọi là hệ chiếu giả hình
trụ, nó không thật sự lưới chiếu hình lăng trụ nhưng có cơ sở toán học tương tự
như hệ chiếu hình lăng trụ.
Tóm lại: Các hệ chiếu bản đồ có 3 thuộc tính không gian cơ bản là: bằng
nhau về diện tích vùng chiếu, sự nhất quán về lưới chiếu và các thuộc tính khác
như góc, hình dạng và mối quan hệ của các yếu tố là ổn định.
Diện tích và quan hệ góc là những thuộc tính rất quan trọng của bản đồ. Song
một lưới chiếu thì không đảm bảo được cả hai tính chất đó. Nghĩa là một hình
chiếu có cùng diện tích thì luôn có quan hệ khác nhau về góc giữa các đối tượng
và ngược lại nếu quan hệ về góc giống nhau thì diện tích lại khác nhau.
Về dạng khác của lưới chiếu là loại lưới chiếu tạo nên sự ổn định hoặc không
ổn định về diện tích song thường có sự bố trí tương đối hợp lý giữa hai tính chất
diện tích và quan hệ về góc. Sự bằng nhau và ổn định là hai thuộc tính có tính
chất toàn cầu về lưới chiếu. Có một số lưới chiếu được áp dụng mang tính địa
phương mà không áp dụng được cho mọi nơi trên một tờ bản đồ. Thông thường
các lưới chiếu này áp dụng cho lập bản đồ tỉ lệ lớn tại một số vị trí cụ thể.
Một ví dụ khác là lưới chiếu phương vị với khoảng cách bằng nhau (azimural
equidistant projection) thể hiện khoảng cách giữa một điểm ở trung tâm của lưới
chiếu và các điểm khác trên bản đồ. Trong trường hợp này, các khoảng cách bằng
nhau đó không thể áp dụng cho bất kỳ một cặp điểm nào khác mà phân bố theo
nguyên tắc khác.
Hệ toạ độ lưới địa lý là không phải hệ Cartesian vì hai lý do sau: trước hết hệ
toạ độ lưới là dựa theo bề mặt cầu và nó không phải là có hai kích thước (hai
chiều).
Thứ hai, mặc dù kinh tuyến và vĩ tuyến là vuông góc với nhau nhưng khoảng
cách từ kinh tuyến đến vị tuyến là luôn khác nhau. Nghĩa là khoảng cách 1 o của
kinh độ thì không phải là luôn bằng khoảng cách 1o của vĩ độ. Vì vậy hệ thống toạ
độ lưới thường không phù hợp cho việc tạo lập toạ độ trong xử lý không gian.
Trong khi đó, hệ thống toạ độ UTM (Universal Transver Mercator) lại được sử
dụng rộng rãi trong HTTĐL do đó khắc phục được những hạn chế của hệ toạ độ
lưới.
Hệ lưới chiếu UTM (Universal Transver Mercator)
Hệ lưới chiếu UTM có cơ sở là phép chiếu Mercator do cục địa chất Mỹ xây
dựng đầu tiên cho một loạt các bản đồ ở vùng vĩ độ 7,5 phút, có phối hợp kiểm tra
bằng hệ thống đo đạc nổi toàn năng theo cực (Universal Polar Stereographic -
UPS)
Trong phép chiếu Mercator đã được dùng từ lâu trong hàng hải thì các đường
tạo lưới có bản chạy dọc theo kinh tuyến. Vì độ lệch tăng dần theo khoảng cách
đến kinh tuyến chuẩn. Phép chiếu Mercator chuyển đổi chỉ dùng có hiệu quả trong
vùng gần với kinh tuyến chính. Vì vậy, toàn bộ trái đất được chia thành nhiều
vùng hẹp thuộc phía Bắc và Nam. Trong mỗi vùng thì sự sai lệch về toạ độ là nhỏ
nhất.
Theo nguyên tắc đó, hệ UTM được tổ chức thành các vùng tính từ Đông sang
Tây, mỗi vùng rộng 6o theo kinh độ. Như vậy toàn bộ trái đất bao gồm 60 vòng. Tỉ
lệ được thể hiện dọc theo 2 kinh tuyến ở phía Đông và phía Tây của kinh tuyến.
Trung tâm có độ ổn định là 0,966.
60 vùng của hệ UTM bắt đầu từ đường đánh dấu quốc tế International Date
Line (IDL) hay là kinh độ 180o căn cứ vào đồ thị vùng thứ nhất (vùng 1) bao phủ
một dải giữa kinh độ nghĩa hoàn hảo khi áp dụng trong một vùng (zone).
Bắc
180W 174W 168W 162W 156W

84Bắc
Xích đạo
80Nam
Nam
Hình 14. Hệ toạ độ UTM

Toạ độ của mỗi một vùng phải được tham khảo một cách độc lập. Ví dụ: toạ
độ ở vùng 11 thì không thể dùng để tham khảo cho vùng 12 hay vùng khác.
Khoảng cách hướng đông được xác định là khoảng cách từ đường trung tâm của
vùng, có giá trị bằng với giá trị của trục nằm ngang trong hệ toạ độ Carsterian.
Đường trung tâm được thiết kế cho việc đo chuẩn về hướng Đông là 500
000m. Với đó, các điểm nằm trong vùng đều giá trị dương. Nếu khoảng cách 1
điểm về hướng Tây lớn hơn 500 000 mét so với đường trung tâm thì điểm đó phải
thuộc về vùng kế tiếp. Một giá trị hướng đông nếu nhỏ hơn 500 000 mét thì nó thể
hiện một vị trí ở phía Tây của đường trung tâm. Toàn bộ các trường hợp, giá trị
hướng đông đều là dương và nhỏ hơn 1 000 000 mét, vì cùng một vùng. Nói cách
khác, chiều dài nằm ngang thực tế của một vùng là rộng nhất ở vùng xích đạo và
nó trở nên rất hẹp khi chuyển dần về phía cực.
Khoảng cách hưởng Bắc: được đo theo hướng Bắc - Nam, nó có giá trị bằng
trục Y (thẳng đứng) trong toạ độ Castersian. Tại bán cầu Bắc, xích đạo được xác
định là đường 0m. Toàn bộ các vị trí trên bán cầu Bắc sẽ có giá trị là khoảng cách
về hướng Bắc bằng khoảng cách đến xích đạo, ở bán cầu Nam, cực Nam được xác
định là có giá trị khoảng cách về hướng Bắc là 0 và xích đạo có giá trị hướng Bắc
là 10 000 000 mét
Hệ toạ độ UTM thực tế về bản chất là hệ Castersian vì đơn vị mét là đơn vị
tiêu chuẩn để đo. Nói tóm lại: một đơn vị khoảng cách trên trục X thì bằng một
đơn vị khoảng cách trên trục Y và khoảng cách về hướng Đông và khoảng cách về
hướng Bắc được đo theo hai hướng vuông góc với nhau. Tất nhiên, có một hạn
chế chính của hệ UTM là nó không thể áp dụng cho những vùng cắt chéo nghĩa là
một khi diện tích nghiên cứu lại nằm ở hai vùng khác nhau thì hệ UTM nhất thiết
phải được chuyển sang hệ lưới chiếu khác để phân tích.
Phần lớn các phần mềm GIS đều có chức năng toạ và chuyển đổi hệ lưới
chiếu và hệ lưới chiếu GRID được dùng rộng rãi để thể hiện bề mặt trái đất, người
phân tích có thể chuyển đổi hệ UTM của 2 vùng liền kề nhau sang kinh độ, vĩ độ
của hệ lưới chiếu GRID. Trường hợp đó thì toàn bộ bản đồ lại phải được xử lý ở
hệ toạ độ khác để phân tích về hệ GRID cũng không phải hệ Cartesian.
Một ưu điểm khác đặc biệt quan trọng của hệ UTM cho phân tích không gian
theo tỉ lệ của địa hình là các vùng của UTM được tổ chức theo hình chữ nhật mặc
dù trong thực tế nó không phải là hình chữ nhật. Nguyên nhân là do khoảng cách
Đông - Tây là khác nhau và đoạn dài của 1o kinh độ luôn khác nhau từ chỗ này
sang chỗ khác. Về tập thể, hệ UTM là chỉ có hiệu quả ở trong dải từ 81o Bắc đến
84o Nam. Ngoài vùng đó thì hệ chiếu cực toàn năng lập thể được sử dụng thay cho
UTM. Một điểm lưu ý là toạ độ của vùng cắt chéo thì không thể sử dụng chung
được.
Hệ toạ độ phẳng quốc gia:
Hệ toạ độ phẳng quốc gia thường được xây dựng để dùng riêng cho mỗi
quốc gia. Hệ toạ độ phẳng được dùng như một tài liệu lịch sử để quản lý đất đai.
Hệ toạ độ này không thích hợp cho việc nghiên cứu mang tính khuvực hoặc một
vùng rộng lớn vì trong thực tế, mỗi quốc gia lại sử dụng một hệ lưới chiếu riêng.
Các nước nằm theo hướng Đông - Tây thì hãy sử dụng hệ lưới chiếu chuyển đổi
Mercator, trong khi đó các nước năm theo hướng Nam Bắc lại sử dụng hệ lưới
chiếu hình nón khối Lambert. Mỗi nước lại chia thành nhiều vùng nhỏ để giảm
thiểu những sai số ưu thế của hệ toạ độ phảng quốc gia là sử dụng đơn vị đo riêng.
Ví dụ ở Mỹ và Anh thì dùng foot (hay feet), inch (1 foot = 12 inch, 1 yard = 3 feet,
1 mile = 5280 feet).
Nhiều nước thì sử dụng hệ mét vì hệ đơn vị này thông dụng hơn khi đo
khoảng cách. Tuy nhiên, đo đạc để lập hệ toạ độ phẳng quốc gia đôi khi gây nhiều
khó khăn cho xử lý không gian ở tỉ lệ khu vực. Lý do không chỉ vì sự chuyển đổi
các đơn vị đó mà việc chuyển hệ toạ độ từ hệ lưới chiếu này sang hệ lưới chiếu
khác đòi hởi những quá trình tính toán phức tạp, đặc biệt là trong trường hợp các
vị trí khác nhau lại được xác định theo các hệ toạ độ khác nhau.
III.4.Các phép đo đạc cơ bản về các đối tượng không gian
III.4.1.Đo đạc các giá trị thuộc tính
Với việc thành lập một hệ toạ độ, mỗi đối tượng điểm cần phải được trình
bày bởi một cặp giá trị toạ độ x và y. Để tiện sử dụng, trong phần này Pi được trình
bày cho điểm thứ i trong một thuộc tính (coverage) và vị trí của một điểm được
xác định bởi (xi, yi). Đối tượng đường: được thể hiện bằng trật tự của các điểm.
Trong lập bản đồ số, các đường cong được chia nhỏ thành hàng loạt các đoạn
thẳng. Tính chất của đường cong sẽ phụ thuộc vào số lượng điểm, nghĩa là phụ
thuộc vào số lượng đoạn thẳng được chia ra. Khi số lượng đoạn thẳng tăng lên thì
đường sẽ gần giống đường cong hơn. Một đường thẳng được xác định bởi hai
điểm nối đầu và cuỗi. Như vậy, một đường Li được trình bày bởi một loạt các
điểm PiS nghĩa là Li (P1, P2, P3… Pn) với n là số lượng điểm xác định lên đường
Li. Một vùng cũng được trình bày bằng cách tương tự với các đường là tập hợp các
đoạn segment thẳng. Trong trường hợp đó thì một đường tròn không thể quan
niệm là một vòng tròn. Thay vào đó đường tròn là tập hợp rất nhiều đoạn thẳng
bằng nhau và chúng tạo nên một vùng có hinhf dạng là tròn. Căn cứ vào đó, một
Polygon Gi được trình bày dưới dạng là Gi (L1, L2, … Lm) với m là số lượng đoạn
thẳng được chia ra để tạo nên polygon.
Một khi các đối tượng không gian được xác định thì việc đo đạc hình học cơ
bản được áp dụng để thực hiện việc đo đạc và tính toán.
Khoảng cách giữa hai điểm trong bề mặt Cartesian (bề mặt thuỷ chuẩn) được
xác định bởi khoảng cachs Ơclit (Euclidean Distance). Hình vẽ sau minh hoạ cho
việc tính khoảng cách giữa hai điểm có toạ độ là (1,4) và (4,2).
Y
P1(1,4)
4
D1,2
3
2 P2(4,2)
X
0 1 2 3 4
Hình 15. Đoạn thẳng segment (D1,2) được xác định bởi hai điểm đầu và cuối
Khoảng cách Ơclit là khoảng cách của một đoạn thẳng nối giữa hai điểm trên
một mặt phẳng. Trong thực tế, việc đo đạc có thể được thực hiện bằng cách khác.
Ví dụ: một phép đo được gọi là đo khoảng cách Manbattan với ý nghĩa như:
"khoảng cách khối phố - city block distance), ở đó áp dụng hệ toạ độ lưới Grid
tương tự như các khối phố. Khi đó khoảng cách Manbattan được tính theo công
thức:
Di,j = (Xi - Xj) - (Yi - Yj)
Diện tích của rất nhiều vùng nhỏ tạo nên một polygon thì có thể được tính
bằng việc lập một đa giác (trapezoid) từ tất cả các đoàn thẳng đó rồi tính tập hợp
cho diện tích của cả polygon.
P2
Y2
P1 P3
Y1
P5
P7
P4
P6
X7 X6 X1 X2 X5 X3 X4
Hình 16. Tính diện tích một polygon theo phương pháp đa giác (trapezoid)
Polygon trên tạo nên từ 7 điểm và 7 đoạn thẳng. Mỗi đoạn thẳng được xác
định bởi hai điểm (điểm nối hoặc điểm giao cắt). Mỗi đoạn thẳng có hai đường
thẳng song song với trục Y để xác định các giá trị X cho từng điểm. Sẽ có các hình
thang (đa giác) được tạo nên bởi các đường thẳng song song đó, đoạn segment và
đoạn hình chiếu của chúng trên trục X, khi đó:
( X i + Yi )( X i − Yi )
Ai , j =
2
Ở đây: Aij: diện tích hình thang
i, j là điểm thứ i và j
Khi áp dụng công thức này và tính cộng dồn chiều kim đồng hồ ta sẽ được
điện tích của polygon (lưu ý khi tính diện tích của các hình thang xác định bởi các
đoạn P7 - P1, P1 - P2, P2 - P3 và P3 - P4 sẽ có giá trị dương và diện tích tạo bởi
các đoạn P4 - P5, P5 - P6, P6 - P7 sẽ có giá trị âm và tổng của tất cả các diện tích
7 hình thang sẽ cho diện tích của polygon G (P1 ... P7).
Tương tự như vậy, nếu ta vẽ tạo thành các tam giác cho toàn bộ các đoạn
segment và đưa về hệ toạ độ ban đầu rồi tính tổng diện tích các tam giác thì kết
quả cũng là diện tích của cả polygon. Hai phương pháp đều có độ chính xác tương
tự như nhau
III.4.2.Đo đạc các tính chất của thuộc tính
Trong cả việc lập bản đồ số và phân tích định hướng của các hiện tượng và
đối tượng không gian thì các đối tượng (hoặc đơn vị địa lý) đều phải được định
lượng hoá và được xử lý theo các giá trị đo đạc. Việc đo các dữ liệu thuộc tính phụ
thuộc vào tính chất mà có thể đánh giá được và khả năng tài liệu cho phép. Việc
đo đạc các tài liệu thuộc tính được chia ra các mức sau: có tồn tại trên danh nghĩa
(niminal), thông thường (ordinal), khoảng cách biệt (interval) và tỉ số (ratio).
Đo đạc các mức độ (levels)
Đo mức độ danh nghĩa (normal): là sự đo đạc về tính chất và chủng loại. Ví
dụ: tên đất nước sinh ra, màu, nơi sinh, địa bàn có quyền bầu cử (ví dụ ở Mỹ).
Tính chất này chỉ mang tính chất đặt tên theo thứ tự mà không có thuộc tính nào
về khoảng cách hay về bản chất. Ví dụ: thứ tự đặt tên theo vần ABC nghĩa là A tốt
hơn B. Cách đặt tên có thể là theo vần hoặc theo thứ tự. Trong trường hợp đặt tên
theo số thứ tự thì giá trị số đó không thể được dùng để tính toán.
Đo mức độ thứ hạng (ordinal): là xác định ý nghĩa trong khái niệm của một
trật tự mà ở đó mỗi một chỉ tiêu có giá trị đồng nhất khi so sánh với các chỉ tiêu
khác. Ví dụ: một người nào đó có thể nằm trong trật tự phân chia về nghề nghiệp
hoặc vị trí xã hội như: công nhân, trí thức, nông dân ... tầng lớp nghèo, trung bình
hay giàu (về mức độ thu nhập). Trong trường hợp đó, tầng lớp trung bình phải ở
thứ hạng cao hơn nghèo và thấp hơn giàu.
Khi áp dụng đo đạc mức độ thứ hạng có thể xác định thuộc tính (code) theo a
b c hoặc theo trật tự số, nhưng mức độ của sự khác biệt giữa các thứ hạng thì
không được làm rõ về định lượng. Vì vậy, trật tự các số hạng không thể dùng để
tính toán về mặt toán học mà chỉ xác định về mối quan hệ. Ví dụ : bảng độ cứng
của các khoáng vật hay cấp bão, cấp động đất là các minh hoạ tương đối rõ của sự
đo đạc và phân chia về số hạng.
Đo khoảng cách biệt (interval)
Việc đo đạc khoảng cách biệt là xác định về trật tự và khoảng cách giữa các
chỉ tiêu, khoảng cách giữa các chỉ tiêu là ổn định và bằng nhau về đơn vị. Ví dụ
điển hình của sự phân chia này là thang nhiệt độ Census (cả nhiệt độ Ken vin).
Trong đó, khoảng khác giữa 50o và 49o là bằng với khoảng khác nhau giữa 49o và
48o. (Tất nhiên 50o thì không có khái niệm là ấm hơn 25o hai lần).
Một tính chất khác nhau trong việc đo khoảng cách biệt là không có giá trị
của điểm khởi đầu. Ví dụ: 0oC là xác định nhiệt độ của điểm đóng băng nhưng
không có nghĩa là ở 0oC là hết nhiệt.
Nói tóm lại, việc đo khoảng cách biệt cho pháp xác định sự khác nhau giữa
các hiện tượng nhưng không có nghĩa về sự khác biệt biên độ (ví dụ, bão cấp 2
không có nghĩa là mạnh hơn gấp 2 lần bão cấp 6 hay kim cứng (độ cứng 10)
không có nghiã là cứng hơn thạch cao (độ cứng 2) là 5 lần.
Đo đạc tỷ số: đo đạc tỉ số thì đầy đủ tính chất của việc đo khoảng cách biệt,
có thêm một thuộc tính là giá trị 0 được xác định bởi đồ thị. Ví dụ, khi đo khoảng
cách tự nhiên, không cách 0 được hiểu là sẽ không có khoảng cách giữa hai đối
tượng. Khoảng cách này được xác định rõ và một điểm giá trị 0 cũng có ý nghĩa tỷ
số đã được tính. Cụ thể hơn về ý nghĩa đó là khi ta nói 10 km có khoảng cách gấp
hai lần 5 km.
Một ví dụ khác là khi tính trọng số cho một đơn vị đo khi trọng số bằng 0
nghĩa là không có trọng số. Nó có ý nghĩa khi nói 10km3 nặng gấp 2 lần 5m 3 .
Trong kinh tế, trọng số thể hiện cho sự thu nhập mặc dù đơn vị tiền tệ tính có thể
khác nhau. Khi đó, định lượng về ý nghĩa hoàn toàn được xác định.
• Đo đạc Sự hướng tâm và sự phân tán (central tendency and disperion):
xác định sự hướng tâm hay phân tán là nội dung quan trọng nhất của xử lý thống
kế các hiện tượng, trong thống kê, sự hướng tâm thể hiện một trường (trend) của
sự phân bố. Trong khi đó, sự phân tán thể hiện độ phân tán so với mức phân bố
(tendency) trung tâm.
Ví dụ khi tính toán tổng thu nhập khi so sánh giữa hai nhóm dân tộc giá trị
trung bình là một giá trị thống kê ở mức hướng tâm giá trị đó có thể được sử dụng
làm chỉ thị cho mức tổng thu nhập, từ đó có thể so sánh thu nhập của hai nhóm với
nhau, khi đó mức độ phân tán cho biết giá trị trung bình.
Với những giá trị khác nhau đo được ở tỷ lệ thông dụng, sự hướng tâm được
xác định bởi giá trị mode, đó là lớp giá trị có tần số phân bố cao nhất. Ví dụ: một
khu vực có 3 dân tộc sinh sống là đân tộc A chiếm 30%, dân tộc chiếm 60% và
dân tộc C chiếm 10%. Trường hợp đó, mode của khu vực là B vì có số dân đông
nhất. Trong trường hợp đó mode thể hiện sự hướng tâm cũng là B nếu như sự
phân bố là ngẫu nhiên, tần số của mode nhóm được xác định là f mode và sự phân
tán ở tỷ lệ đo thông dụng được tính bởi tỷ số khác biệt (variation ration).
V = 1 - (f mode/N)
Ở đây: V là tỷ số khác biệt
N là tổng số phân bố
Giá trị nhỏ hơn của sự phân tán thể hiện cho trường hợp hướng tâm nhiều và
mode là chỉ thị tốt hơn cho trường phân bố. Nếu như một nhóm dân tộc chiếm
nhiều hơn 80% tổng số dân trong vùng thì tỷ số sự khác biệt là 0,2. Nếu dân tộc
chiếm đa số song cũng chỉ đạt 80% tổng số dân thì trường hợp đó tỉ số phân tán là
0,6.
Mức tập trung của việc đo sự khác biệt về thứ hạng được tính bởi giá trị
trung bình, đó là trường hợp có sự tập trung ở giữa (nghĩa là có một số giá trị cao
hơn hoặc thấp hơn giá trị trung bình). Vì sự khác biệt được đo ở tỷ lệ về thứ hạng
nên toàn bộ các trường hợp có thể phân bố dạng phân nhánh, có nhấnh nằm ở thứ
hạng cao hoặc tháp hơn giá trị trung bình. Trường hợp đó giá trị trung bình sẽ rơi
chính xác vào khoảng giữa của tập hợp. Ví dụ nếu có 15 người lớn thược về nhánh
đi xuống ở một tầng lớp trong xã hội thì trường hợp thứ 8 là thuộc về giá trị trung
bình của vùng phân bố này. Khi đó giá trị trung bình cho biết một điều là nếu có
một người thuộc về thứ hạng cao hơn thì có thể vẫn thuộc về thì có thể vẫn thuộc
về tầng lớp đó hoặc cao hơn. Còn những người ở thấp hơn thứ hạng thì vẫn có thể
thuộc về tầng lớp đó hoặc ở thấp hơn.
Sự phân tán của sự khác biệt về thứ hạng được tính theo tỷ lệ thập phân, với
sự khác biệt giá trị giữa định và đáy của phân vị thứ 10. Ví dụ: điều tra sự phân tán
về ưu thế cuộc sống của 50 thành phố, thứ hạng khác biệt xây dựng theo tỉ lệ từ 1 -
10, khi đó 10 sẽ là ưu thế cao nhất. Nếu như có 5 thành phố có ưu thế nhất thì nó
có thể nằm ở thứ hạng là 8 thuộc về phần đỉnh của thứ hạng 1 - 10, còn lại là 45
thành phố sẽ nằm ở phần đáy của thứ hạng và có giá trị là 3, và như vậy sự khác
biệt (phân tán) sẽ là 5 (khác biệt giữa 3 và 5). Ngược lại, việc điều tra cho thấy có
5 thành phố thuộc về thứ hạng 6, còn lại 45 thành phố thuộc thứ hạng 4 thì sự
phân tán chỉ là 2. Nói tóm lại, giá trị thứ hạng của sự khác biệt là thể hiện mức độ
của sự khác biệt và thứ hạng đó được dùng ở tỷ lệ thập phân.
Sự tập trung của cả việc đo về khoảng khác biệt (interval) hay tỉ số (ratio)
đều được tính toán theo giá trị trung bình:
Z=
∑Z i
N
Ở đây: Zi là trường hợp phân bố thứ i trong vùng phân bố.
Σi là tổng các giá trị Z trong vùng phân bố
N tổng các phân bố
Sự phân tán so với giá trị trung bình được tính bằng độ khác biệt hay phương
sai (variance) hay độ lệch tiêu chuẩn (Standard Deviation).
σ2 = ∑ N
(Z −Σ ) i
2
Ở đây: σ là phương sai

Σ là độ lệch chuẩn
Độ lệch chuẩn lớn hơn thì sự phân tán cũng cao hơn còn nếu độ lệch nhỏ thì
sự tập trung cao hơn.
Trong nhiều trường hợp, giá trị trung bình và độ lệch tiêu chuẩn của nhiều
phép đo có thể không thích hớp cho việc xử lý các hiện tượng không gian khi mà
trọng số không gian cần được tính đến. Ví dụ, trong một phân bố mà các đơn vị
địa lý khác nhau về kích thước thì giá trị trung bình chỉ là chỉ thị tốt cho yếu tố
kích thước là có trọng số rất lớn. Trong trường hợp này, sự tập trung có thể được
tính toán theo khái niệm giá trị trung bình được điều chỉnh theo vùng (area -
adjusted mean):
Σ=
∑Z A i
∑A i
Ở đây: Ai là vùng của đơn vị thứ i, và độ lệch điều chỉnh theo vùng được
tính như sau:
σ 2
=
∑ A ( Z − Σ)
i i
2
∑A i
Sự hướng tâm và phân tán là các thông số cơ bản nhất của việc thống kê để
mô tả một sự phân bố cuả bất kỳ một hiện tượng không gian nào. Chúng cũng
được dùng để so sánh các mẫu không gian của sự phân bố các yếu tố khác nhau
với mục đích phân biệt sự khác nhau ảnh hưởng đến mỗi yếu tố. Sự thống kê
mang tính mô tả cũng được sử dụng để phân tích sự thay đổi trong việc phân bố
của một hiện tượng để hiểu tốt hơn và phân tích được rõ ràng những sự sắp xếp
phân bố không gian.
Ví dụ sau thể hiện sự phân bố không gian của 3 loài chim với sự hướng tâm
và phân tán khác nhau. Sự phân bố là ở kích thước giống nhau và hình dạng địa lý
giống nhau. Như vậy, sự phân bố được tổ chức thành ô lưới với kích thước 5 x 5 ô.
Các ô đánh dấu đen là có sự phân bố chim, còn ô trắng là không có. Sự hướng tâm
thể hiện vị trí tập trung trung bình của các loài.
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
A B C
Hình 17. Ví dụ về sự phân bố không gian
Nhóm A xuất hiện tập trung ở góc trên bên trái. Giá trị trung bình tính toán
của toạ độ x và y là (2,2), còn nhóm B và C có giá trị trung bình ở toạ độ là (3,3).
Như vậy nhóm chim A có sự hướng tâm khác với nhóm B và C, còn nhóm B và C
có sự hướng tâm giống nhau. Độ lệch của sự phân bố không gian được tính bằng
độ lệch tiêu chuẩn. Nhóm A và B tuy có sự hướng tâm khác nhau nhưng lại có độ
lệch tiêu chuẩn với toạ độ của x và y là 0.83 và 0.83. Nói cách khác, phương thức
hai nhóm A và B là có sự phân tán quanh giá trị trung bình giống nhau. Còn nhóm
C, mặc dù có cùng giá trị hướng tâm với nhóm B song có sự phân tán rộng hơn, vì
khi tính độ lệch chuẩn của nhóm C với x và y là 1.63 và 1.63. Giá trị đó thể hiện
sự phân tán của nhóm C bằng hai lần của 2 nhóm kia. Nói cách khác, nếu giá trị độ
lệch lớn thì phương thức phân bố là kém tập trung xung quanh trung tâm.
Tóm lại, phần này giải thích và trình bày cách tính định lượng các giá trị về
vị trí và thuộc tính của các đối tượng không gian. Trong thực tế bản đồ là sự thể
hiện 2 chiều và vị trí của bất kỳ một đối tượng nào cũng được xác định bằng cặp
toạ độ x và y. Tuy nhiên việc chuyển vị trí từ hình cầu với 3 kích thước sang mặt
phẳng nằm ngang có 2 kích thước luôn luôn là vấn đề gặp sai số trong việc xử lý
phép chiếu. Các phân tích không gian nhất thiết phải chú ý đến các tính chất của
phương pháp chiếu được sử dụng trong những dữ liệu gốc. Các giá trị toạ độ luôn
khác nhau giữa các hệ thống toạ độ, ở Mỹ và một số nước Tây âu hay sử dụng hệ
lưới chiếu UTM hay Gausse. Một khi hệ toạ độ được chọn chuẩn xác thì mọi phép
tính trong xử lý không gian có thể được áp dụng bằng các phép toán trong các
phần mềm GIS (ví dụ tính độ dài, diện tích polygon).
Để bổ sung cho việc đo đạc tư liệu về vị trí các phân tích không gian yêu cầu
việc xử lý các dữ liệu thứ hạng và dạng tỉ số. Viêc thống kê giá trị hướng tâm và
phân tán phải căn cứ vào tỉ lệ đo đạc hay trả lời với các câu hỏi khác nhau. Giá trị
hướng tâm và phân tán được xử lý bằng mode và tỉ số.
BÀI TẬP
1. Đổi vị trí của một điểm ở vĩ độ 45o Bắc và kinh độ 171o Tây sang hệ
toạ độ UTM với giả thiết Trái đất là hình cầu thực.
2. Mô tả hệ toạ độ UTM cho một điểm góc toạ độ 496 000 m hướng
Đông, 20 000 m hướng Bắc, vùng 5 có sử dụng phốip hợp kinh độ, vĩ độ và
mét.
3. Dùng phương pháp hình thang tính diện tích của Polygon dưới đây
(hoặc vẽ tay).
- Tính toạ độ x, y cho các điểm nối tạo nên Polygon.
- Tính độ dài của mỗi segment và chu vi của Polygon.
IV.ĐIỀU KHIỂN CÁC LỚP THÔNG TIN

Điều khiển một hệ thông tin không gian là một chức năng cực kỳ quan trọng
của HTTĐL, vì nó thiết kế dữ liệu ở một khuôn dạng thích hợp cho việc tình bày
bản đồ và phân tích không gian. Trong việc điều khiển HTTĐL có hai phương
thức chính (categories) là: điều khiển một lớp thông tin và điều khiển lớp thông
tin. Điều khiển một lớp là xử lý các thông tin của một lớp trong một thời gian, còn
điều khiển nhiều lớp là xử lý thông tin của nhiều lớp một cách đồng thời. Theo
kinh nghiêm áp dụng thì hai phương thức này được xử lý hầu như độc lập với
nhau. Phần lớn các áp dụng của HTTĐL đều xử lý thông tin một lớp trước rồi mới
thực hiện điều khiển (xử lý) cho nhiều lớp. Vì vậy, để tiện cho việc áp dụng hai
phương thức này sẽ lần lượt được trình bày riêng.
IV.1.Điều khiển thông tin một lớp
Điều khiển thông tin một lớp được gọi là điều khiển theo phương thức nằm
ngang (horizontal operation) với ý nghĩa là chỉ có một lớp tư liệu và xử lý tư liệu
chỉ theo phương thức nằm ngang hay hai chiều mà thôi. Tuy nhiên, việc điều
khiển này cũng sẽ được trình bày ở chương tiếp theo. Trong điều khiển thông tin
một lớp, tư liệu gôc được tổ chức ở dạng vector và mỗi lớp bao gồm đặc điểm
riêng của từng đối tượng. Ví dụ: toàn bộ các điểm được tổ chức thành một lớp
riêng và nó không pha trộn với các thuộc tính của đường hoặc polygon. Như vậy,
việc xử lý cũng chỉ được thực hiện ở chức năng xử lý nhiều lớp thôgn tin. Trong
nội dung xử lý thông tin một lớp, có 3 loại chính là: điều khiển tích chất (Feature
Manipulation); phân loại tính chất (Feature Classification); Lựa chọn tính chất
(Feature Selection).
Điều khiển tính chất: có những việc chính là xử lý ranh giới và phân tích sự
quan hệ gần nhau (proximity).
Lựa chọn tính chất: có nội dung là xác định tính chất thông qua xử lý đồ hoạ
hay phân tích logic hoặc mô tả đặc điểm của các đối tượng được phân biệt.
Phân loại tính chất: lựa chọn và phân nhóm đối tượng theo tính chất với các
chỉ tiêu thông kê.
Điều khiển tính chất (Feature Manipulation)
Điều khiển tính chất của một lớp thông tin bao gồm hai nội dung chính là xác
định tương quan về ranh giới của các đối tượng có sự biến đổi. Trong một số
trường hợp, sự thay đổi đó xác định nên các đối tượng mới.
Phân tích quan hệ gần gũi là xử lý để tạo nên các polygon mới trên cơ sở
khoảng cách từ các đối tượng được lựa chọn trên bản đồ.
Điều khiển ranh giới (Boundary Operation)
Các công việc được thực hiện trong điều khiện ranh giới gồm có: cắt nhỏ
(chipping), xoá (erasing), cập nhật (updating), chia đôi (spliting) và tẩy bỏ, xoá
(dissolving), các thuật ngữ trên được dùng trong ARC/INFO. Đối với một số phần
mềm khác, tên gọi của công việc (hay thuật ngữ) có thể khác đi.
• Cắt nhỏ (SPLIT). Quá trình chia cắt nhỏ là việc tạo ra một tập hợp
(coverage) mới, trong đó có chứa một phần của bản đồ ban đầu. Toàn bộ các tính
chất của bản đồ ban đầu. Toàn bộ các tính chất của bản đồ năm trong một tập hợp
các ranh giới được lưa chọn và lưu ở một tập hợp (converage) mới. Nói tóm lại,
tập hợp mới là một phần của bản đồ gốc và được xác định bằng tính chất địa lý.
Công việc này hay được thực hiện khi một phần của bản đồ được sử dụng trong
phân tích. Ví dụ: mạng lưới giao thông của một vùng hay một tỉnh được tách từ
mạng lưới giao thông của cả nước. Khi đó, công việc phải làm là tách tất cả những
đường thuộc ranh giới khu vực nghiên cứu để tạo nên một lớp thông tin về đường
của khu vực (hình 18).
Hình 18. Cắt nhỏ bản đồ gốc để tạo nên bản đồ mới với diện tích nhỏ hơn
Sơ đồ sau sẽ minh hoạ rõ hơn: converage ban đầu có 5 vùng. Nếu dùng SLIP
để cắt ở giữa thì sẽ có một bản đồ mới với thuộc tính là một phần của bản đồ cũ
1
1
2 3
2 3
4 5
4 5
A b c
Hình 19. Kết quả của việc cắt để tạo nên một coverage mới
Khi sử dụng thì vòng tròn bên ngoài của b được sử dụng làm ranh giới cắt.
Kết quả là tạo ra bản đồ C với một số thuộc tính của bản đồ A vẫn còn giữa
nguyên song có diện tích được quy định bởi ranh giới cắt. Tóm lại, cắt lại việc
copy một phần của bản đồ gôc để toạ nên một bản đồ mới
• Xoá (ERASE): xoá là quá trình ngược lại với việc cắt. Xoá là công
việc loại bỏ những phần mà công việc trung gian tạo nên (ví dụ việc cắt) là làm
khôi phục lại những phần có thuộc tính của bản đồ gốc ở trong vùng đã được cắt
ra sẽ bị xoá.
1 1
2 3
2 3
4 5 4 5
xo¸ kÕt qu¶

gèc
Hình 20. Ví dụ của việc xoá để tạo nên một coverage mới
Công việc xoá là rất có ích khi mà tính chất các vùng ở ngoài vùng phân tích
cần vẽ lại như cũ hoặc ngược lại cần loại bỏ đi. Việc này cũng hữu ích khi có
nhiều lỗi tập trung ở một vùng nào đó thì có thể xoá chúng đi để rồi chỉnh sửa lại.
Các vùng cần xóa thường có hình dạng đều đặn hoặc không đều tuỳ người đều
hành.
• Cập nhật (update) hay bổ sung: Cập nhật là công việc thay đổi dữ
liệu không gian trong một vùng nào đó của bản đồ với những thộc
tính mới.
thuéc tÝnh vµo cËp nhËt thué c tÝnh kÕt qu¶ thué c tÝnh
A b c
Hình 21. Cập nhật thuộc tính của B cho A để tạo nên một thuộc tính mới
Trong ví dụ ở hình A, hai đường thẳng cắt vuông gọi là không chính xác và
cần phải chỉnh sửa phần ở giữa. Nếu chỉnh toàn bộ A thì khó khăn hơn là chỉnh
một phần ở giữa. Để chỉnh sửa, ta dùng phần thuôc tính bổ sung ở B để sửa, kết
quả là tạo nên phần thuộc tính mới, ở đó có giữa lại một phần thuộc tính cũ của A
và có chỉnh sửa một phần giữa theo B. Vì vậy, tình năng cập nhật có tác dụng rất
hiệu quả khi cần chỉnh sửa từng phần của một cơ sở dữ liệu rộng lớn.
• Gắn/ nối (append mapjoin): Việc gắn và giáp nối bản đồ là công
việc tương tự, thay cho quá tách, chia bản đồ, đây là việc ghép nối các bản đồ
thành một bản đồ lớn. Hai chức năng này hơi khác nhau một chút, tuỳ thuộc vào
việc tổ chức dữ liệu. Sự khác biệt là việc giáp nối thì không tái tạo hay chia cắt
thuộc tính hình học ở phần bản đồ kết quả. Quá trình gắn và giáp nối là ngược với
quá trình chia đã nêu ở trên. Hình dưới đây là minh hoạ của quá trình gắn và giáp
nối bản đồ.
1 2 2 3
2 3
1
4 5 5 6 5
4 6
4 5 5 6
7 8 9
7 8 8 9
Hình 22. 4 Bản đồ được ghép nối bằng chức năng gắn/ nối bản đồ
Trên hình vẽ 17, 4 bản đồ đất nguyên thuỷ có 4 thuộc tính (coverage) riêng.
Khi gắn/ giáp nối, 4 bản đồ tạo thành một bản đồ lớn ở bên phải. Có một chức
năng phụ phải thực hiện sau khi giáp nối là làm sạch, tẩy nước ranh giới không
cần thiết ở bản đồ kết quả. Thông thường ở ARC/INFO, đó là chức năng
dissolving.
• Tẩy sạch (dissolving): chức năng tẩy là loại bỏ các ranh giới không
cần thiết sau khi các bản đồ đã được giáp nội. Ngoài ra, chức năng này còn cho
phép đặt tên lại các điểm nối giữa các đường với các giá trị thuộc tính xác định.
Thông thường, chức năng này kiểm tra tất cả các đoạn thẳng để xác định xem các
đoạn thẳng khi nối với nhau có cùng thuộc tính như yêu cầu hay không. Trong
trường hợp hai polygon giáp nối là có cùng thuộc tính (ID) trong khi ở bản đồ kết
quả có một segment ở giữa thì có thể loại bổ segment đó đi để giáp nối cả hai
polygon đó với nhau.
A
B
A B A
B
C C
B
B
A
Hình 23. Kết quả của việc tẩy sạch để tạo nên một coverage mới
Ở hình bản đồ bên trái sau khi ghép nối còn có 7 polygon. Tuy nhiên thực tế
chỉ có 3 loại đất là ABC, sau khi kiểm tra toàn bộ các segment thì loại bỏ các
segmen grafi nối các polygon có cùng tên (cùng loại đất). Kết quả là các polygon
A được ghép lại, các polygon B cũng được ghép. Bản đồ kết quả chỉ cò 4 polygon
với 3 loại đất riêng biệt.
Đối với phân tích không gian, chức năng tẩy hay làm sạch hay được sử dụng
để thiết lập các mô hình. Trong trường hợp đó, một mô hình được thiết lập để mô
tả các mẫu không gian và hệ số đánh giá được sử dụng để hiệu chỉnh cho các đặc
điểm không gian. Mỗi đối tượng được xác định với một giá trị thuộc tính phù hợp,
căn cư vào hệ số đánh giá của mô hinh. Ranh giới giữa các đối trượng tiếp giáp
nhau mà có cùng tính chất thì được tẩy đi để tạo nên một mẫu không gian mới.
Chức năng tẩy sẽ được đề cập tiếp ở phần sau.
• Loại bỏ (Eliminate): chức năng loại bỏ được áp dụng phổ biến trong
trường hợp do lỗi của tư liệu có những đường không muốn được hình thành tạo
nên nhiều đường nhỏ và nhiều polygon nhỏ vụn (Sliver polygons). Tình trạng có
nhiều polygon nhỏ vụn thừa luôn xảy ra trong kết quả của việc chồng xếp các lớp
bản đồ. Khi có 2 polygon chồng lên nhau, do qua trình số hoá mà hai mảng thuộc
tính của hai lớp sẽ có xu hướng tạo nên nhiêu polygon nhỏ vụn.
Bản đồ ban đầu Bản đồ sau khi loại bỏ
Hình 24. Áp dụng chức năng loại bỏ để chỉnh sửa bản đồ.
Tạo vùng đệm từ các đối tượng polygon: khi mở rộng, hai polygon (bên trái)
sẽ tạo nên một polygon ở bên phải:
Hình 25. Tạo vùng đệm từ các đối tượng
Trong việc tạo vùng đệm chiều rộng của vùng đệm có thể tạo khác nhau cho
từng phần (đệm), đường (polygon) hoặc có các mức khác nhau song cũng có thể là
tạo tất cả giống nhau (nghĩa là cùng một chiều rộng). Ví dụ: khi nghiên cứu sự ô
nhiễm không khí, vùng mở rộng tính từ nguồn là một hàm của mức độ ô nhiễm
tính từ mỗi nguồn điểm. Trong trường hợp này, chiều rộng của vùng bị ô nhiễm sẽ
có cá mức khác nhau tuỳ theo mức ô nhiễm.
Lợi ích của việc tạo vùng đệm trong phân tích không gian là tạo nên các
vùng có cùng khoảng cách với một đối tượng lựa chọn. Chức năng này rất có ích
cho việc phân tích mối quan hệ về sự phân bố và tác động giũa các đối tượng
không gian.
Ví dụ, giả sử muốn nghiên cứu sự tương quan giữa các giá trị và khoảng cách
của mạng lưới giao thông huyết mạch (chính) thì khoảng cách của từng chỗ đến
đường giao thông gần nhất cần phải được xác định (hình)
Trong hình, các vùng có cùng khoảng cách tới đường giao thông chính được
vạch ra. Phương pháp này có thể áp dụng cho việc định giá đất tính từ đường giao
thông chính quy hoạch tưới tiêu tính từ sông hoặc để tính các vùng kế cận nhau.
Hình 26. Tạo các vùng đệm với các khoảng cách khác nhau
Phân tích sự gần gũi (Proximity analysis)
Phân tích sự gần gũi là công việc dựa vào cơ sở về khoảng cách của các
điểm lựa chon. Tạo một vùng mở rộng của một đối tượng, thông thường được
hiểu là việc tạo vùng đệm (buffer operation). Việc tạo vùng đệm có thể thực
hiện cho rất nhiều kiểu đối tượng, bao gồm cả điểm, đường và polygon. Vì quá
trình tạo vùng đệm là sự mở rộng về diện tích nên kết quả luôn tạo thành các
đối tượng polygon.
H×nh : Qu¸ tr ×nh t¹o vïng ®Öm cho ®èi t−î ng ® iÓm
H×nh : Qu¸ tr ×nh t¹o vïng ®Öm cho ®èi t−î ng ® −êng
Figure 27. Kết quả phân tích sự gần gũi

Trong quá trình tạo vùng đệm, nếu có nhiều mức với nhiều khoảng cách khác
nhau tính từ một đối tượng, thì ranh giới giữa các mức sẽ được vạch ra hay là tạo
nên các đường đẳng giá trị (isolines)
Một kiểu phân tích sự gần gũi khác là tạo nên các polygon Thiessen - hay
cũng gọi là các polygon gần nhất. Các polygon Thiessen được tạo từ một loạt điểm
và các polygon được tao ra chia khu vực thành các vùng phụ (tương tự như phụ
lưu vực trong thuỷ văn). Mỗi một phụ vùng đó thì phần bên trong là gần gũi với
điểm đó hơn là so với điểm khác.
Hình 28. Kết quả phân tích sự gần gũ Thiessen i

Việc tạo lập các polygon thiessen có thể áp dụng cho nhiều nội dung nghiên
cứu khác nhau, kể cả tự nhiên và xã hội. Trong kinh tế, ví dụ của hình là sự phân
chia các vùng kinh tế, với trung tâm là các tụ điểm thương mại. Như vậy, các
đường segment tạo nên nơi giáp nhau của các vùng nhỏ sẽ là nơi có khả năng buôn
bán tốt.
Việc phân tích sự gần gũi có thể áp dụng cho điều hành nhiều lớp thông tin
mà ở đó các khoảng cách khác nhau được tạo nên trong quá trình phân tích, áp
dụng cụ thể sẽ được đề cập đến ở phần sau.
Phân biệt và lựa chọn (identification and selection): việc xử lý thông tin theo
phương nằm ngang cũng cho phép sử dụng để phân biệt các đối tượng không gian
trong một bản đồ hay một cơ sở dữ liệu. Trước hết, công việc này có thể thực hiện
bằng việc xử lý sơ đồ tương tác, sau đó có thể áp dụng phương pháp xử lý logic
với cơ sở dữ liệu.
Phân tích sơ đồ tương tác cho phép người sử dụng có thể phân biệt các đặc
điểm đối tượng bản đồ trực tiếp từ màn hình máy tính. Ví dụ: di chuyển con trỏ
vào các vị trí cần quan tâm và ngay lập tức có thể tìm được các đối tượng và thuộc
tính của chúng để xử lý (kể cả đối tượng đường, điểm). Với polygon thì phải đưa
con trỏ vào bên trong polygon để phân tích và xác định các thuộc tính (hình)
Cho một ví dụ về quản lý đất đai: có thể tìm thuộc tích của bất kỳ một thửa
ruộng nào bằng một bảng thống kê cụ thể: số thứ tụ, tên chủ đất, ký hiệu (code),
diện tích, giá trị đất.
parcel 231-12-
owner join Doe

zoning A3
area 7500
value 235-790
H×nh Cho 1 vÝ dô vÒ qu¶n lý ®Êt

®
elevation = 347
Hình 29. Xác định độ cao của một điểm bằng con trỏ và màn hình
Công việc xác định đó cũng có thể thực hiện bằng cách dựa vào các thuộc
tính trong cơ sở dữ liệu. Việc xác định các đối tượng còn được gọi là lựa chọn đối
tượng (feature selection). Tóm lại, việc lựa chọn đặc điểm đối tượng có thể áp
dụng một cách linh hoạt, tuỳ điều kiện của người sử dụng.
Ví dụ: có thể căn cứ các điều kiện để lựa chọn trong mô hình không gian
(if...then), trong đó có một số đặc điểm sau:
9 Các đặc điểm có thể lựa chọn trực tiếp từ bản đồ: ví dụ có thể đưa con trỏ
chạy đến từng vị trí trên bản đồ để lựa chọn các đối tượng địa lý đồ hoạ.
9 Có thể lựa chọn theo thuộc tính theo vùng đánh dấu, ví dụ chọn các vùng
có cùng một số thuộc tích trong một bản đồ có nhiều vùng khác nhau.
Lựa chọn để tự tìm kiếm các đối tượng trong một vùng đánh dấu.
®èi t−îng ®iÓm
®iÓm ®−îc lùa chän
Khu vùc chung
k hu vùc ®−îc chän
H×nh : lùa chän theo vïng
Hình 30. Sự lựa chọn đối tượng theo vùng

Ngoài ra, xử lý logic có thể được thực hiện bằng việc xử lý các câu hỏi hoặc
xử lý logic toán học với các điều kiện đặt ra (như thuật toán). Tuy nhiên thuật toán
này thường chỉ áp dụng cho xử lý nhiều lớp thông tin và phần sau sẽ đề cập kỹ
hơn.
Khi đã lựa chọn xong thì các yếu tố được lựa chọn. Các phép tính thống kê
cơ bản bao gồm tính các giá trị trung bình, độ lệch, cực đại, cực tiểu, ngưỡng, tần
số của các thuộc tính lựa chọn. Những phép tính thống kê đó cung cấp cơ sở cho
việc xử lý không gian. Ngoài ra, việc phân tích tần số còn cung cấp những thông
tin hữu ích về dữ liệu.
a c
b
Khu bu«n b¸n kh«ng bj ngËp

Khu bu«n b¸n kh«ng bj ngËp Khu d©n c− bj ngËp
Khu bu«n b¸n bj ngËp

Khu d©n c− kh«ng bj ngËp
Khu d©n c− bj ngËp
Khu d©n c− kh«ng bj ngËp
Hình 31. Kết quả nhom gộp các nhóm đối tượng
Trong đa số các trường hợp áp dụng, sự phân bố tần số được tính từ sơ đồ
phân loại đưa ra trước. Với sơ đồ đó ta có thể tiến hành gộp nhóm các đối tượng
hoặc phân tích, mô tả quy luật phân bố.
Với HTTĐL, việc phân tích tần số của bản đò cần phải có cơ sở dữ liệu với
nhiều thuộc tính hoặc nhiều đối tượng khác nhau.
Phân loại tư liệu (Data Classification)
Phân loại là công việc rất phổ biến trong xử lý dữ liệu không gian. Đó là một
trong những công việc tổ chức lại dữ liệu ban đầu với nhiều thuộc tính thành
những dữ liệu mới theo mục đích sử dụng. Trong phân loại, trước hết phải xác
định được số lớp cần chia, hoặc các ngưỡng cần phân chia. Tuỳ thuộc tần số phân
bố của các đối tượng mà có nhiều phương pháp phân loại khác nhau.
-Xác định quy luật phân bố tần số: có 6 mẫu phân bố cơ bản là: đồng nhất
(uniform), bình thường (normal), có hai cực trị (bimodal), đường thẳng xiên
(linearly Skewed), cong (non-linear slewed), nhiều lớp (multiple clusters).
®ång nhÊt b×nh th−êng hai cùc trÞ
xiªn (to¸n häc) xiªn cong (h×nh häc) nhãm
Hình 32. 6 mẫu phân bố tần số thông dụng

Nếu như sự phân bố tần số có dạng gần với dạng đồng nhất thì có thể phân
loại một cách đơn giản theo nguyên tắc tạo các khoảng không đổi (constant
interval) hay là tạo một loạt các bậc bằng nhau. Trường hợp đó cần xác định các
giá trị cực đại, cực tiểu của tài liệu, sau đó toàn bộ dải tài liệu được chia ra các lớp
bằng nhau.
-Phương pháp phân loại theo nguyên tắc cùng tần số. Nguyên tắc là phân
loại để tạo nên các lớp cùng các hoặc gần cùng tần số trong mỗi lớp. Toàn bộ các
đối tượng sẽ rơi vào các lớp có trật tự ở trên hay ở dưới. Tổng số các đối tượng
được phân chia theo số lớp và giới hạn của từng lớp được xác định một cách chủ
quan hoặc ngẫu nhiên. Hạn chế của phương pháp này là ranh giới của các lớp
không xác định được bằng toán học.
Khi sự phân bố tần số giống với sự phân bố chuẩn thông thường (normal) thì
việc phân loại có thể dựa vào giá trị trung bình trừ đi độ lệch chuẩn còn lớp thứ hai
được xác định bằng giá trị trung bình trừ đi độ lệch chuẩn. Hai lớp khác nằm trong
dải trung bình x1 độ lệch chuẩn đến trung bình -2 độ lệch chuẩn. Một cặp thứ 3:
trung bình -1 độ lệch chuẩn và trung bình – 2 độ lệch chuẩn:
Lớp 1 đến lớp 2: từ X - 2δ đến X - 1δ
Lớp 3 đến lớp 4: từ X - 1δ đến X - 1δ
Lớp 5 đến lớp 6: từ X - 1δ đến X- 2δ
Nhìn chung, số lượng lớp được phân chia ra trong sự phân bố chuẩn thường
là 6,4 hoặc 2.
Trong dạng phân bố hai cực trị, dãy tư liệu được chia thành hai nhóm tách
biệt. Trong trường hợp này, trước hết phải tiến hành chia tài liệu thành hai nhóm
rồi chia mỗi nhóm thành các lớp theo phương pháp đã nêu ở trên.
Nếu tư liệu phân bố theo dạng đường chéo (hay đường dốc) với độ dốc tương
đối ổn định. Trường hợp này phải dựa theo nguyên tắc tiến triển số học để phân
loại. Ngưỡng của lớp thứ K được xác định:
TK = b - (K - 1) d
Ở đây: b là khoảng đầu của sự tiến triển toán học
d: hằng số tăng lên
K: hệ số (>1)
To = 0
Ranh giới của các lớp L và U được tính:
LK = a - ∑TK - 1
UK = a - ∑TK
Ví dụ:
nếu a = 0, b = 0, d = 0 thì khi K = 1, giới hạn của lớp K = 1 là (0,10), khi lớp
K= 2 là (10, 30), K = 3 là (30, 60), K = 4 là (60, 100).
Nếu a = 0, b = 10, d = 2 thì các giới hạn đó là K1(10, 22), K2(22,36),
K3(36,52).
Trong trường hợp này, sự thay đổi về khoảng dọc theo dãy tiến triển thể hiện
hướng xiên của đồ thị phân bố.
Trong thực tế sự phân bố tần số của số liệu thường phức tạp hơn sự phân bố
theo mẫu, đặc biệt là dạng phân bố theo nhiều nhóm (multi cluster distribution),
phức tạp nhất song lại thường gặp. Trong đó, đường cong phân bố thể hiện có
nhiều lớp với chiều rộng khác nhau, nhiều cực trị khác nhau và độ cao cũng khác
nhau. Khi đó số lớp không thể tính bằng phương pháp số học mà phải tính một
cách ngẫu nhiên. Theo kinh nghiệm, có thể áp dụng cách phân lớp theo nhánh
(hierarchical clustering). Phương pháp này cho phép xác định một cách tối ưu số
lượng lớp và ranh giới các lớp. Cách thức tiến hành như sau:
9 Bước đầu mỗi đối tượng được xác định là một nhóm hợp phần
9 Mỗi lần làm lại thì một đối tượng bất kỳ có sự khác biệt nhất với nhóm
được phát hiện và gộp với nhóm đó.
9 Cứ như vậy, mỗi lần chia lại thì số lượng nhóm được giảm đi 1, cuối
cùng toàn bộ các đối tượng được thành những nhóm riêng.
Các giá trị thống kê: SSw, SSb, và tỉ số SSw/SSb được tính cho mỗi công
đoạn (SSw là tổng của phương sai trong mỗi nhóm, SSb là tổng phương sai giữa
các nhóm, việc gộp nhóm xác định được các đối tượng nào ở cùng một lớp, số
lượng các lớp tự nhiên được xác định bởi đường cong của tỉ số SSw/SSb.
Góc bên phải đường cong: khi số lượng lớp bằng số lượng đối tượng và SS =
0, tỉ số SSw/SSb = 0.
Góc bên trái đường cong: số lượng đối tượng = 1, SSb = 0 và tỉ số SSw/SSb
=∞
Theo nguyên tắc "ngón tay cái" thì số lượng các lớp được chia dựa vào chỗ
gồ lên của đường cong. Ý nghĩa là khi phân loại bắt đầu từ phía xa bên phải đường
cong, tỉ số sẽ được tăng dần đến chỗ đường cong bị ghồ lên. Sau chỗ đó thì tại
một điểm bất kỳ, giá trị tỉ số sẽ tăng lên rất nhanh so với điểm trước nó. Sự phân
loại sẽ được xem xét khi mà tỉ số còn thấp ở giá trị chấp nhận được.
Với mỗi tập hợp thống kê khác nhau thì có một phương pháp phân loại thích
hợp. Vấn đề cần thiết đặt ra trong phân tích không gian là phải tìm được phương
pháp phân loại phù hợp cho một tập hợp nhất định. Những phương pháp đã nêu ở
trên là dựa vào tư liệu thuộc tính. Nếu như mục tiêu phân loại là để xử lý không
gian tạo nên các mẫu không gian khác nhau thì phương pháp phân loại lại được áp
dụng theo nguyên tắc khác.
Trong trường hợp cá đối tượng bản đồ là các polygon, có thể áp dụng hệ số
phân chia (fracmentation index) để phân loại:
m −1
ρ=
n −1
Ở đây: ρ: hệ số phân chia nhỏ
m: số vùng tiếp giáp trên bản đồ
n: số đơn vị bản đồ gốc
Đối với thuộc tính của polygon, n là số lượng polygon trước khi phân loại và
tẩy sạch, m là số lượng polygon sau khi phân loại và tẩy sạch (phương pháp đã
nêu ở trên). Giá trị của m luôn nhỏ hơn hoặc bằng n và giá trị ρ thay đổi từ 0 – 1.
Về lý thuyết thuần tuý, khi m = n thì sự phân loại tạo nên kết quả là mỗi
polygon trong một lớp thì khác với toàn bộ các polygon kế cận. Trong trường hợp
này, hệ số phân chia mảnh ρ có giá trị là 1 thì tạo nên số lượng tối đa các mảnh
trong kết quả phân loại, với xu hướng khác thì toàn bộ các polygon được phân loại
thành chính các polygon đã có trên bản đồ tổng hợp. Vì khi m = 1, ρ = 0 khi đó
các polygon là không đổi. Ví dụ sau sẽ minh hoạ rõ cho phương pháp phân loại
này.
Hình 33. Phân chia bản đồ thành các vùng theo hệ số chia mảnh khác nhau
Bản đồ gốc có cấu trúc lưới 5 x 5, mỗi ô có giá trị xác định.
Trong cả hai kết quả, bản đồ đều chia thành 3 lớp
Ở A: ρ = (8-1)(25 -1) = 0,29 (số vùng nhiều hơn = 8)
Ở B: ρ = (3-1)(25 -1) = 0,08 (số vùng ít hơn = 3)
Để tiện áp dụng, trong xử lý không gian, việc điều khiển một lớp thông tin và
nhiều lớp thông tin được tách thành hai chức năng riêng biệt trong phần mềm
HTTĐL. Tuy nhiên đa số trong thực tiễn, hai việc này đều phải được thực hiện
trong xử lý không gian.
Điều khiển một lớp thông tin thường là bước chuẩn bị tư liệu hay là biến đổi
các tư liệu gốc theo từng lớp để tạo thành một hay nhiều lớp thông tin cần thiết
cho bước xử lý tiếp theo.
Việc chuẩn bị dữ liệu đó phải dựa vào các thuộc tính của tư liệu. Thông
thường có 3 dạng chuẩn bị: điều khiển thuộc tính, phân biệt lựa chọn đối tượng và
phân loại đối tượng.
• Trước hết, việc điều khiên các đối tượng bản đồ có thể áp dụng nhiều
cạch. Với vùng rộng của các đơn vị tự nhiên thì phải chia nhỏ thành các phù vùng
với diện tích nhỏ hơn. Ngược lại, với các vùng quá phân tán thì lại phải gộp thành
càc vùng lớn hơn. Từng phần của tài liệu có thể được loại bỏ, bổ sưng thêm vào
hoặc lựa chọn để thích hợp với công việc xử lý tiếp theo.
• Thứ hai, các đối tượng bản đồ có thể phân biệt và lựa chon từ cơ sở dữ
liệu thông qua các phép toán quan hệ hoặc logic, công ivệc này sẽ tạo nên những
tư liệu mới cần thiết. Việc phân biệt và lựa chọn có thể thực hiện bằng phân tích so
sánh và áp dụng nhiều thuật toán, tuỳ thuộc vào đặc điểm của dãy tư liệu.
• Thứ ba, các đối tượng không gian có thể được phân loại trước khi phân
loại họăc thiết lập mô hình, áp dụng HTTĐL, bảng phân bố tần số của các đối
tượng không gian cần được thành lập và từ đó các phương pháp phân loại có thể
được lựa chọn và áp dụng.
Bài tập thực hành
Số hoá hoặc vẽ 2 bản đồ đường giao thông và ranh giới thành phố (không vẽ
các đường chấm rời là đường phân vùng của thành phố và ngoại ô).
A B
a e
b
B¶n ®å ®−êng giao th«ng B¶n ®å ph©n vïng

a. Giữ riêng ranh giới thành phố bằng cách Split
b. Tách riêng bản đồ giao thông của thành phố bằng Clip
c. Tẩy bỏ bản đồ giao thông thành phố bản đồ ban đầu. So sánh kết quả
với bản đồ của kết quả b.
d. Sử dụng bản đồ kết quả của b rồi bổ sung thêm các đường của thành
phố B trong bản đồ phân vùng. Bổ sung thêm bằng các đường chấm Update
của bản đồ A vào để tạo kết quả bản đồ đường giao thông (được update) của
thành phố B.
e. Tạo các vùng đệm (Buffer Zone) cho bản đồ d với từng chiều rộng
bằng 1/10 của cạnh bản đồ gốc. Xác định các thuộc tính của các polygon của
bản đồ giao thông (có vùng đệm).
f. Thiết lập bảng tần số phân bố cho các vùng đệm trong thành phố.
Phân loại các polygon trong sơ đồ A thành 3 lớp tuỳ thuộc vào các chỉ tiêu
xác định và tính toán hệ số phân mảnh của từng cách phân chia theo khoảng bằng
nhau (constant interval) và tần số đều (equal frequency) và 1 - 3, 4 - 9, 20 - 12 và 1
- 2, 3 - 10, 11 –12.
IV.2.Điều khiển thông tin nhiều lớp (multilayer operation)

Điều khiển nhiều lớp thông tin được hiểu là điều hành theo phương thẳng
đứng (Vertical operation) với cơ sở là dựa vào mối quan hệ giữa các lớp thông tin.
Việc xử lý này cung cấp khả năng cơ bản nhấ cho việc phân tích không gian vì nó
cho phép điều khiển dữ liệu ở những lớp riêng biệt đồng thời kiểm tra mối liên
quan giữa các đối tượng khác nhau. Với việc điều khiển này có thể tách tư liệu của
một lớp thành nhiều lớp với mục đích là để phân tích bầt kỳ một mối quan hệ nào
giữa các yếu tố của các hiện tượng tự nhiên. Ngược lại, nhiều lớp thông tin của
một vùng cũng có thể được tổng hợp lại tạo nên một lớp đơn để tiện lợi trong quá
trình xử lý và thiết lập mô hình
Các chức năng trong phân tích không gian có thể chia thành 3 nhóm chính:
phân tích chồng xếp các lớp (overlay), phân tích quan hệ gần gũi về không gian,
phân tích quan hệ không gian.
• Phân tích chồng xếp: là xử lý mối quan hệ lôgic và tổ hợp thông tin
không gian của nhiều lớp thành một lớp riêng biệt.
• Phân tích qun hệ gần gũi có mục đích là đo đạc về khoảng cách giữa các
đặc điểm đối tưonựg ở các lớp khác nhau.
• Phân tích quan không gian để làm rõ môi quan hệ giữa cá đối tưonựg
khác nhau.
Chồng xếp nhiều lớp thông tin
Nguyên tắc của chồng xếp thông tin là xử lý điều kiện logic, trong đó thuật
toán Boolean là hay sử dụng. Điều kiện logic được sử dụng với yếu tố dữ liệu
(operand) và quan hệ giữa các yếu tố dữ liệu (operation). Các quan hệ thường gặp
bao gồm: AND, OR, XOR (không có OR) và NOT.
Hình 34. Mô phỏng quan hệ giữa hai lớp thông tin bằng thuật toán Boolean
Quan hệ có/không có (TRUE/FLASE) của thuật toán Boolean, mỗi một bài
toán được đặc trưng bởi một điều kiện logic đặc trưng để xác định các điều kiện
chồng xếp thông tin của hai lớp và kết quả là có (TRUE) hay không (FALSE).
Trên hình vẽ, A và B là hai dữ liệu và thể hiện là 1 có (TRUE), 0 là không có
(FLASE), ý nghĩa:
A and B: kết quả phải thể hiện cả tính chất của A và B
A or B: kết quả có tính chất của A hoặc B
A not B: Kết quả có A mà không có B
A xor B: kết quả không có A nhưng có thể có B và ngược lại.
Có 3 chức năng thông dụng của việc chồng xếp nhiều lớp là: tổng hợp(
union), giao cắt ( intersection) hoặc tách biệt (identity).
1 1 2 1
3 6
2 4 5
2 3 7 8
3
9 10
12 13
4 5 11 14
B (3 polygon) C (14 polygon)

A (5 polygon)
Hình 35. Quan hệ logic giữa các lớp thông tin véctơ
Trong hình, tổ hợp hai lớp A (5 polygon) và B (3 polygon) sẽ cho C với 14
polygon. Ở C, thuộc tính ID của các đơn vị sẽ là cả thuộc tính của các lớp ban đầu
(nếu không chồng lên nhau) và thuộc tính tổng hợp với những đơn vị tạo nên do
chồng hai đơn vị của hai lớp ban đầu (ví dụ ID của lớp 1 là 4, của lớp 2 là 5 thì ở
C, đơn vị mới của 1 và 2 sẽ là tổ hợp, kể cả trong trường hợp không có ID mà chỉ
có tên gọi thì cũng tương tự (trong trường hợp hai lớp bản đồ khác nhau về tính
chất).
• Giao cắt (intersect): phép giao cắt trong thuật toán Boolean được
hiểu là phép quan hệ AND. Ý nghĩa cụ thể của quan hệ này như sau: khi có hai
thuộc tính của hai lớp được đưa vào bảng chồng xếp với AND thì chỉ có nhiều
phần thuộc tính nào được nhắc đến ở những lớp Input thì mới tồn tại ở lớp kết quả.
ở lớp kết quả, thuộc tính cùa các đối tượng là thuộc tính tổng hợp. Tóm lại, ý
nghĩa chính của INTERSECT là những lớp kết quả phải được tồn tại ở trên cả
những lớp ban đầu và phần giao cắt nhau.
1 1 1
2 3 2 2 3
4 5
3
6 7
4 5 8 9
A input(1) B input(2) C
output(kÕt qu¶)
Hình 36. phép giao cắt trong thuật toán logic

Các đối tượng của lớp Input có thể là điểm, đường và polygon, song nhất
thiết intersect chỉ xử lý cho polygon. Như vậy ở input phải có sự chuyển thông tin
trước sang polygon. Ví dụ: tạo một vùng nằm cách đường cao tốc 500m từ bản đồ
sử dụng đất và tính các diện tích của từng đơn vị trong vùng đó. Trước hết phải tạo
vùng buffer của đường, sau đó mới tạo intersect.
• Đồng nhất (Identity): Trong phép tính đồng nhất, các đối tượng ở
bên trong ranh giới của các lớp ban đầu được gọi là input coverage và identity
coverage được lựa chon tạo nên một lớp mới. ở phần bên trong, các thuộc tính mới
được tạo thành từ việc gộp (merging) các thuộc tính của các lớp ban đầu. Phép
tính đồng nhất có thể thực hiện cho cả việc nhập thuộc tính điểm, đường và
polygon, song indentity luôn phải là polygon. Nếu input là điểm thì kết quả chỉ
chứa thông tin của điểm mặc dù lớp indentity luôn phải là polygon. Tương tự như
vậy, nếu input là đường thì kết quả chỉ có đường. Trong thực tế, yêu cầu là sau khi
thực hiện xử lý các thuộc tính của lớp input phải được giữ nguyên.
1 1 1
2 2 5
3 3 4
2
6 7
3
8 9
4 5 11 12
11 14
input identity kÕt qu¶
Hình 37. Kết quả trong phép tính đồng nhất (Identity)
Ví dụ: xác định phân bố thực vật ở vùng phân bố động vật hoang dã tại khu
vực A (phân tích từ ảnh)
Sau khi phân tích ảnh, lập được 3 lớp bản đồ phân bố các loại thực vật chính,
ta lập bản đồ bằng phép identity để xác định mối liên hệ giữa phân bố động vật và
các loại thực vật chính trong khu vực. Kết quả sẽ có toàn bộ các loài thực vật
chính cả cả 3 lớp có ở trong vùng phân bố.
• Phân tích tính tần số hay mật độ (Frequency/density): Phân tích
không gian thường yêu cầu tính toán tần số (đếm) hay mật độ của đối tượng có ở
một lớp song lại được tính (hay đếm) ở một vùng nhất định thuộc lớp khác (lớp cơ
sở), dữ liệu của lớp ban đầu có thể ở dạng điểm, đường hoặc polygon. Ví dụ: tính
số cây xuấ hiện ở trong một vùng khoanh định. Để giải quyết vấn đề, phải có 2
lớp: lớp 1 - phân bố cây trong toàn vùng; lớp 2 - ranh giới khu vực cần nghiên
cứu.
Khi chồng xếp (overlay) 2 lớp sẽ tính được số cây trong vùng cần nghiên cứu
theo đơn vị diện tích. Trong trưòng hợp tính cho đường, thường tính theo độ dài
của đường mà không tính số lượng đường. Phép tính này hay sử dụng để nghiên
cứu địa chất. Sau khi xử lý xong, có thể tiếp tục thực hiện bản đồ phân bố mật độ
hoặc sơ đồ hoa hồng để phục vụ nghiên cứu đứt gãy - kiến tạo. Ngoài ra có thể áp
dụng cho việc nghiên cứu mật độ đường giao thông, nghiên cứu phân bố dân tộc
hặc phân bố các loài động thực vật.
Tương tự như vậy, có thể tính toán mật độ cho polygon. Phép tính này có thể
áp dụng cho nhiều nội dung nghiên cứu khác nhau: chẳng hạn để nghiên cứu sự
tập trung (đồng nhất) hay phân tán của một số loài thực vật trong một khu vực
nhất định.
¾ Phân tích quan hệ gần gũi:
Quan hệ gần gũi có thể được phân tích nước cách, tuỳ thuộc vào đặc điểm
đối tượng. Sự gần gũi giữa các polygon có thể được tính bằng phương pháp
khoảng cách tách biệt chung (interseparation distance), cụ thể hơn đó là khoảng
cách tách biệt giữa chu vi các polygon, hay khoảng cách giữa cá vị trí trung tâm
(centrer locations). Việc nghiên cứu khoảng cách giữa các điểm trung tâm được
thực hiện theo nguyên tắc đo khoảng cách giữa các điểm. Việc đo quan hệ gần gũi
giữa các đường được thực hiện trong việc phân tích mạng lưới. Trong phần này,
nội dung xử lý được áp dụng chỉ cho các đối tượng điểm mà thôi.
¾ Quan hệ gần (NEAR): Chức năng NEAR trong xử lý HTTĐL có khả
năng phát hiện các điểm hoặc đường trong một lớp với một điểm ở trong lớp khác
và tính toán khoảng cách tới điểm đó.
x
x
x
x x
Hình 38. Sơ đồ hàm NEAR tính khoảng cách một điểm tới đường gần nhất
Mối quan hệ NEAR có thể dùng để xác định vị trí gần nhất tới một đối tượng
đường hoặc điểm, đây là những tính toán trong việc thiết kế các điểm cấp nước,
các chòi canh chống lửa cháy trong rừng.
¾ Tính khoảng cách các điểm (Point Distance): Thuật toán này dùng
để tính khoảng cách giữa các điểm ở lớp này tới điểm khác ở lớp khác. Cũng có
thể áp dụng tính toán này cho một lớp.
x
x
x
x x
Hình 39. Tính khoảng cách điểm

Điểm A có thể là cùng lớp với các điểm khác song cũng có thể là ở lớp khác.
Từ A tính được khoảng cách tới các điểm khác và số điểm trong vùng một bán
kính nhất định tính từ A. Trong ví dụ trên, khoảng cách có thể đo giữa nhiều điểm
và nhiều nội dung như sau:
• Đo khoảng cách giữa các điểm với nhau one - to - one (các điểm có thể ở
cùng hoặc khác lớp) lớp cơ sở (base) và lớp tiêu (target).
• Đo khoảng cách từ một điểm tới nhiều điểm one - to - many (điểm chính
nằm ở lớp khác với các điểm xung quanh).
• Đo khoảng cách nhiều điểm tương ứng với nhau many - to - many (hai
nhóm điểm nằm ở hai lớp).
• Đo khoảng cách giưa bất kỳ điểm nào trên lớp cơ sở với toàn bộ các điểm
trên lưới tiêu ( many - to - all).
Tương tụ như vậy, phép đo khoảng cách cũng có thể được thực hiện để đo
giữa điểm ở lớp cơ sở và yếu tố đường ở lớp tiêu, với các phương thức (one - to -
one), (one - to - many), (many - to - many), (many - to - all).
¾ Phân tích mối quan hệ không gian: spetial corretation analysis:
Mục tiêu của việc phân tíhc là xác định mối quan hệ giữa các dạng khác nhau của
các đối tượng không gian. Cụ thể là phân tích và xác định về quan hệ phân bố giữa
các đối tượng ở lớp này với các đối tượng phân bố ở lớp khác của dữ liệu không
gian.
Ví dụ: phân tích để xác định mối quan hệ giữa đất và thực vật. Sau khi tổng
hợp và xử lý thông tin sẽ xác định được mối quan hệ của từng nhóm hoặc loại cậy
với đất và ngược lại. Nếu quan hệ đó là chất thì thực vật có thể của từng nhóm
hoặc loài cậy với đất và ngược lại. Nếu quan hệ đó là chất thì thực vật có thể được
dùng làm chỉ thị cho đất nằm ở phía dưới và ngược lại đất có thể dùng làm chỉ thị
cho việc đánh giá tiềm năng về diện tích một số loài thực vật nhất định.
Vì vậy hiểu được mối quan hệ giữa các đối tượng là rất quan trọng trong điều
hành không gian. Việc phân tích có thể được thực hiện bằng nhiều cách, tuỳ thuộc
vào tỷ lệ đo đạc của các thông số cần nghiên cứu. Ở tỷ lệ thông thường, có thể
định mối quan hệ bằng cách sử dụng bảng ngẫu nhiên (contigency table) và bình
phương của hệ số khoảng tra độ thích hợp nhất.
Nếu sự khác biệt là theo khoảng hoặc tỉ lệ thì hệ số tương quan và mô hình
giật lùi (regression model) sẽ cung cấp phương pháp thích hợp hơn cho việc
nghiên cứu mối quan hệ.
Phương pháp bình phương của hệ số kiểm tra là thích hợp nhất. Việc phân
tích tần số sẽ được áp dụng để xác định các mẫu không gian trong việc phân bố
của các hiện tượng. Việc đó cũng được sử dụng để kiểm tra các giả thiết về mối
liên quan giữa các hiện tượng. Trong phân tích quan hệ, phải xác định được xu
hướng mà tần số sẽ tăng lên tại một vùng nào đó chẳng hạn.
Trong việc nước, tội phạm và ma tuý sẽ tìm được vị trí phát sinh khi xác định
được mối quan hệ giưã những hành vi phạm tội và sự phân bố của một nhóm
người nào đó khi phân tích đặc điểm dân cư của một khu vực. Các nhà sinh vậy
học sẽ tìm được mối quan hệ của một số loài sinh vật quý hiểm với một số quần xã
thực vật. Khi nghiên cứu phân tích mối quan hệ giữa động vật và thực vật. Trong
HTTĐL, đó là công việc phân tích quan hệ thông tin giữa các lớp tư liệu.
¾ Hệ số liên quan( hay hệ số quan hệ ): ở tỷ lệ đo đạc thông thường,
phương pháp tính hệ số liên quan cho phép xác định được mối liên hệ giữa hai lớp
thông tin khác biệt. Khi nghiên cứu ở tỷ lệ khoảng (interval) hay tỉ số khác biệt
(ratio) thì thường áp dụng hệ số tương quan giật lùi. Đây cũng là phương pháp phổ
bién trong xử lý các mô hinh không gian. Về bản chất việc tính hệ số tương quan
chỉ cho biết xu thế liên quan về giá trị của các thông tin. Trong việc tính tương
quan giật lùi thì tính toán một cách cụ thể đương phương thức của sự liên quan. Ví
dụ: nói rằng x và y có quan hệ tỉ lệ thuận chặt chẽ, song trong tính tương quan giật
lùi còn cho biệt được phương thức liên quan, chẳng hạn y = 2x, nghĩa là y tăng
theo tỷ lệ 2x.
Trong ví dụ sau sẽ minh hoạ rõ phương thức thính mối liên hệ giữa các vị trí
so với trạm giao thông và giá vé. Với các khoảng cách khác nhau thì giá tiền để
tính từ bến tàu cũng khác nhau (xem sơ đồ):
Gi¸ t iÒn
(000)
32
28
24
20
1 2 3 4 5
Kho¶ng c¸ch (km)
Hình 40. Tinh toán khoảng cách giữa các vị trí khác nhau
Ở đây: n là số lượng các đơn vị bản đồ (trong bảng n = 8)
Sx và Sy là độ lệch chuẩn của x và y
x là giá tiền và y là khoảng cách
r sẽ có giá trị thay đổi từ -1 đến 1.
Nếu giá trị đó dương thì quan hệ đó là tỉ lệ thuận và ngược lại, r âm thì quan
hệ là tỉ lệ nghịch.
Nếu r =1 thì quan hệ rất chặt. Nếu r = 0 thì không có quan hệ.
Tóm lại, một yêu cầu cơ bản của HTTĐL là phải có khả năng xử lý tư liệu và
tổ chức thành những lớp riêng biệt, có quan hệ logic. Sự phân bố của cá hiện
tượng địa lý là phức tạp và bao gồm nhiều yếu tố có quan hệ theo nhiều phương
thức khác nhau. Một trong những chức năng của HTTĐL là phân tích được
phương thức phân bố của các yếu tố thông qua các số liệu. Xử lý nhiều lớp thông
tin cho phép tách biệt hoặc kết hợp để xử lý một cách hiệu quả các số liệu thống
kê ban đầu.
Trong xử lý nhiều lớp thông tin có một số phương thức cơ bản là chồng xếp,
xác định sự gần gũi và xác định quan hệ đó. Thuật toán Boolean được áp dụng
tương đối phổ biến trong các phép xử lý đó.
• Phép chồng xếp là thiết lập sự liên kết không gian giữa các lớp tư liệu
riêng biệt, từ đó liên kết được các yếu tố khác nhau.
• Phân tích sự gần gũi là phân tích và thiết lập cá khoảng cách lân cận, tạo
nên những lớp thông tin mới.
• Phân tích quan hệ là xác định mối liên quan giữa các hiện tượng và sự
phân bố không gian của các đặc điểm khác nhau giữa một hay nhiều lớp tư liệu.
BÀI TẬP
1. Số hoá bản đồ đất và thực vật có nội dung như sau:
- Bản đồ đất có các loại đất được gọi tên theo số 101, 102, 103, …
- Bản đồ thực vật có: đất cỏ, thông, sồi, …
- Chồng xếp hai lớp theo chức năng tổ hợp (Union), tạo bảng tổng hợp
sự phân bố và bảng dự báo.
§Êt thùc vËt
101
102
103
101
Cá
Th«ng
Såi
2. Số hoá bản đồ sử dụng đất và bản đồ ngập lụt

- Chồng xếp theo phương thức identity
- Cho giá trị bảo hiểm đất:
vùng 1 - 30USD/ha
vùng 2 - 40USD/ha
vùng 3 - 50USD/ha
vùng 4 - 60USD/ha
- Thiết lập tần số phân bố và tính giá trị bảo hiểm của đất cho mối loại
L o¹i ®Êt Vïng ngËp lôt
1
a b
2
d
c 3
3. Áp dụng chức năng NEAR để tạo các Buffer đường, điểm.

- Tính khoảng cách từ các điểm tới các đường.
V.Phân tích mẫu điểm
Điểm là hình thức phân bố rất phổ biến trong tự nhiên đặc biệt là trong thực
tế của công tác nghiên cứu, quản lý tài nguyên, môi trường. Trong phân tích điểm,
toàn bộ các điểm được phân tích xử lý chứ không phải chỉ có phân tích cho từng
điểm riêng biệt.
Vì điểm là đối tượng có kích thước bằng 0 nên việc đo đạc về điểm thường là
đo các thông số sự phân bố, mật độ và xác định vị trí của điểm. Diện tích của điểm
thường không được đo mặc dù chúng chiếm một diện tích nhất định trên bản đồ.
Thông thường những thông số định lượng về các điểm được coi là bằng nhau.
Về sự phân bố của các điểm, các thông số sau thường được tính đến như: tần
số xuất hiện, mật độ, vị trí hình hoạ, độ lệch không gian và sự sắp xếp không gian.
Những nghiên cứu về điểm phần lớn dựa vào các nguyên tắc của thống kê mô tả.
Tần số là số điểm xuất hiện trên bản đồ. Đây là thông số đầu tiên hay được
đo về phân bố điểm. Nếu thông số này được đo trong nhiều thời gian thì các số
liệu được áp dụng về quá trình tiến triển của điểm hay của tập hợp điểm. Nếu diện
tích vùng nghiên cứu là khác nhau thì thông số được so sánh là mật độ điểm theo
một đơn vị diện tích.
Thuộc tính hình học của điểm cần được xác định, đó là vị trí trung tâm và độ
lệch của điểm so với trung tâm của vùng tập trung.
- Vị trí tâm điểm: xác định bằng toạ độ x, y.
- Độ lệch đo giá trị độ lệch chuẩn so với giá trị trung bình.
Cần chú ý rằng trong trường hợp giá trị độ phân tán lớn thì các trung tâm về
mặt hình học không nhất thiết đúng là nơi độ hướng tâm cao, hình mô tả cho các
dạng phân bố điểm khác nhau.
A b c d
Hình 41. Mô tả cho các dạng phân bố điểm khác nhau

Độ phân tán có thể được tính theo trục X hay Y tuỳ theo các giá trị độ lệch
chuẩn mà hình dạng phân bố của các điểm có thể là hình kéo dài, elip hoặc phân
tán.
ph©n b è ®Òu, tËp trung ph©n bè ph ©n t¸n p h©n bè ngÉu nhiªn
Hình 42. Độ phân tán của các điểm

Để tính hệ số gần gũi thì cho một điểm gần nhất cần được phát hiện và đa
đạc khoảng cách tới điểm đó.
Nếu gọi di là khoảng cách từ một điểm gần nhất thì giá trị:
Ad = (∑i di)/n là giá trị khoảng cách trung bình gần nhất của mẫu điểm với n
là tổng số điểm trong vùng nghiên cứu.
Mỗi điểm được xác định bằng toạ độ và khoảng cách được đo trực tiếp trên
bản đồ. Như vậy khi Ad nhỏ thì các điểm là gần nhau hơn.
Trong trường hợp phân bố ngẫu nhiên, có thể áp dụng công thức sau để tính
khoảng cách trung bình giữa các điểm:
1 A
Ed =
2 n
Ở đây: A là diện tích bản đồ.
n: là số điểm
Ed là khoảng cách trung bình giữa các điểm. Có thể áp dụng để tính
cho mọi sự phân bố. Trong phân bố đều, hai điểm liền kề có thể chồng lên nhau và
khi đó khoảng cách là 0.
Hệ số láng giềng gần nhất được tính như sau:
Ad
NNI =
Ed
Giá trị NNI giữa hai khái niệm giao động từ 0 - 2,1491
Khi toàn bộ các điểm mẫu rơi vào một vị trí thì khi đó Ad = 0, NNI = 0
Trong trường hợp phân bố phân tán, khoảng cách giữa các điểm tăng lên, lúc
đó Ad là cực đại và NNI đạt tới 2,1491. Khi NNI = 1, mẫu được coi là có phân tán
ngẫu nhiên và lúc đó Ad = Ed.
Nhìn chung, nếu NNI có giá trị nhỏ thì đặc trưng cho phân tán theo nhóm
đều, ở bảng trên, các giá trị NNI của 3 nhóm là: Nhóm A có NNI = 0,41, nhóm B
= 2,03, nhóm C = 1,08.
Với các kiểu phân bố nói trên, độ lệch chuẩn được tính như sau:
Z = (Ad - Ed) δ Ad
Z: độ lệch chuẩn của nhóm
δ: độ lệch chuẩn của Ad
n là số điểm
Phân tích theo nguyên lý chia 4 (quadrat) và nguyên lý Poisson
Phân tích theo nguyên tắc chia 4 là phương pháp đưa phân bố mẫu vào bản
đồ có chia thành các ô nhàm mục đích xác định sự phân bố. Cơ sở của nguyên tắc
là dựa vào sự xuất hiện tần số trong các ô chứ không dựa vào khoảng cách tách
biệt. Các ô có thể khác nhaua về kích thước và hình dạng, có thể đặt ngoài hoặc
trong bản đồ. Có nhiều cách phân tích khác nhau. Một phương pháp là đặt ô lưới
vào trong bản đồ và đếm các điểm xuất hiện trong từng ô rồi phân loại các ô dựa
theo tần số xuất hiện của các điểm trong đó. Để phân tích một cách có hiệu quả thì
số điểm xuất hiện trong một lớp ít nhất phải là 5 điểm. Nếu trong các ô đã chia số
điểm xuất hiện ít hơn 5 (chẳng hạn 1, 2, 3, 4) thì phải gộp các ô đó thành một lớp
với nguyên tắc số điểm trong một lớp phải lớn hơn hoặc bằng 5.
Đối với mỗi lớp, tần số quan trắc được trong một số ô được qui định là Qi
với i là lớp thứ i, xác xuất xuất hiện trong mỗi ô được tính theo phân bố Poisson
λe Ï − λ
P( x) =
x!
x là tần số trong ô (đếm trong ô)
λ là tần số giả định cho ô chuẩn
e (số e) là cơ số cua logarit tự nhiên = 2,718282
Tần số phân bố giả định được tính cho mối lớp i là Ei
x2 = ∑ i (0i - Ei)2Ei
Với x2 có giá trị nhỏ hơn số thống kê trong bảng thì theo lý thuyết, đó sẽ là
mẫu phân bố ngẫu nhiên. Ví dụ sau sẽ minh hoạ cho nội dung trên:
A b c
ph©n bè ph©n t ¸n ph©n bè ngÉu nhiªn ph©n bè nhãm
Hình 43. Sự phân bố ngẫu nhiêncua các điểm

Có 3 mẫu với 3 kiểu phân bố khác nhau (A: phân tán, B: ngẫu nhiên, C:
nhóm) được chia thành các ô nhỏ theo kết quả có 36 ô. Kết quả tính được cho lớp
A như sau: Căn cứ vào kết quả tình thì mức phân bố tự do của các lớp tính được
cho lớp A là:
x2 = 0,23 - 3,96 - 3,15 = 7,34
Giá trị này > ∑x nên phân bố này không phải là phân bố ngẫu nhiên. Tương
tự ta tính được các giá trị của x2 cho lớp B và C và đưa ra được kết quả về sự phân
bố của B là ngẫu nhiên còn C thì không phải là ngẫu nhiên.
Tự liên kết không gian (Spatial Autocorrelation)
Phân tích mẫu điểm theo phân bố poisson cũng có những hạn chế vì phương
pháp này chỉ căn cứ vào tần số xuất hiện đếm được, song lại không quan tâm đến
sự phân bố của các ô phần tư, vì thế quan hệ không gian không được xết đến.
Hình 44. Mô hình phân bố không gian
Trong ví dụ mô phỏng ở trên, 2 kiểm phân bố hoàn toàn khác nhau song
không được xét đến. Vì vậy phải áp dụng một phương pháp khác để nghiên cứu
quan hệ không gian giữa các đối tượng, dựa trên nguyên tắc là xem xét ảnh hưởng
của các đối tượng ở những vùng liền kề nhau.
Trong việc nghiên cứu mỗi quan hệ, những tác động ảnh hưởng đến sự phân
bố của các lớp nằm liền kề nhau được xem như tác động đến xu hướng phân bố
toàn bộ các điểm theo từng nhóm.
Một khi có sự cạnh tranh giữa các đối tượng chiếm ưu thế của quá trình phân
bố trong không gian, nghĩa là có tình trạng một đối tượng tồn tại theo xu thế loại
bỏ các đối tượng khác ở xung quanh mình, thì sự phân bố đó thể hiện sự phân bố
phân tán song lại có quan hệ không gian chặt. Nếu không có xu hướng làm tan
hoặc đẩy lùi trật tự không gian cũ thì sự phân bố đó là ngẫu nhiên và không có
quan hệ không gian.
Để tính mối quan hệ đó, hệ số hay được sử dụng là hệ số Morans (Moran
1948, Cliff và Ord 1981):
n∑ i ∑ jδij ( xi − x)( xj − x)
I=
So∑ i ( xi − x) 2
Ở đây: So = ∑ i ∑j δịj
Giá trị dự kiến và độ lệch được tính như sau:
E (1) = −(n − 1) −1
n 2 S1 − nS 2 + 3So 2
I=
So 2 (n 2 − 1)
Ở đây: S1 = (1/2) ∑ i ∑j (δij - δij )2
S2 = ∑i (∑i δij - Ej δji)2
n là số đơn vị địa lý - hay là số điểm
δij: hệ số liên hệ không gian giữa điểm thứ i và thứ j
Xi: tần số phân bố không gian
So: tổng số cặp có trong quan hệ không gian
Giá trị hệ số i thường thay đổi từ -1 đến 1. Nếu giá trị i là dương là lớn (<=
1) thì phân bố theo nhóm nếu i là <= 0 thì phân bố là phân tán. Khi i = 0 thì không
có quan hệ và khi đó phân bố là ngẫu nhiên.
Hai ví dụ nêu trong hình trên không có sự khác biệt nếu dùng hệ số poisson,
song nếu dùng hệ số i của Morans thì sẽ tính được i = -95 cho hình bên trái vì đó
là phân bố theo nhóm và quan hệ đó là chặt. Còn cho hình bên phải, i có giá trị -
2,1, đó là đặc trưng cho phân bố phân tán.
Một việc cần chú ý trong việc tính quan hệ không gian là độ chính xác của
việc tính toàn còn phụ thuộc vào độ phân giải của các ô được chia ra. Trong một
số trường hợp hệ số i không thể áp dụng cho việc tính với phân bố của điểm.
Trong khi nghiên cứu, cần có sự so sánh giữa hệ số i với các hệ số khác như hệ số
gần gũi NNI (Nearest Neighborn Index) hoặc giá trị thống kê Poisson, từ đó có thể
đưa ra những kết luận phù hợp.
Lấy mẫu các đối tượng điểm
Việc lấy mẫu là rất quan trọng trong phân tích mẫu điểm, đặc biệt là khi tư
liệu có khối lượng lớn. Nếu thuộc tính không gian có thể khai thác được từ một
mẫu thì không nhất thiết phải xử lý toàn bộ các đối tượng và thông thường điều đó
khó thực hiện vì không thể lấ toàn bộ mẫu. Chẳng hạn để xác định độ cao địa hình,
phải đo theo các điểm lựa chọn chứ không thể đo độ cảo ở khắp mọi nơi.
Một trong những ứng dụng quan trọng khác của việc lấy mẫu không gian là
sự ngoại suy trong xử lý không gian. Về mặt lý thuyết, phải lựa chọn phương pháp
ngoại suy thích hợp đối với từng hệ thống mẫu. Vì vậy trong lấy mẫu có nhiều
phương pháp khác nhau.
• Lấy mẫu phi không gian: là việc lấy mẫu không có tham khoả các hợp
phần không gian. Ví dụ: trong marketing, có thể chào hàng một cách bất kỳ theo
số điện thoại ở danh bạ mà không cần tham khảo bản đồ. Tuy nhiên các mẫu này
vẫn được sử dụng trong xử lý không gian.
• Lấy mẫu không gian: HTTĐL sẽ trở nên có hiệu quả cao nếu xử lý một
hệ thống mẫu được lấy theo nguyên tắc không gian, nghĩa là có sự tham khảo các
yếu tố địa lý khi lấy mẫu. Ví dụ: nếu điều tra về hộ trong vùng ngoại ô, có thể sử
dụng tài liệu điều tra theo các tuyến, sau đó lựa chon ngẫu nhiên 10% chủ hộ trong
mỗi tuyến để phỏng vấn. Như vậy kết quả sẽ sát thực tế hơn là việc lựa chọn ngẫu
nhiên theo số điện thoại cứ cách 10 số lại hỏi 1 số.
Số lượng điểm lấy mẫu có thể là ngẫu nhiên. Trong trường hợp toàn bộ các
điểm đều có các giá trị ID riêng và khi đó việc lấy mẫu vẫn được coi là phi không
gian vì việc xử lý sẽ không tham khảo yếu tố hình học.
Song song với việc lấy mẫu trên, một mẫu ngẫu nhiên có thể được lấy riêng
biệt bằng cách xác định toạ độ của từng điểm rồi đưa lên bản đồ, sau đó lựa chọn
các mẫu theo từng phương thức. Ví dụ khi lấy mẫu theo vòng tròn với bán kính
nhất định. Trường hợp đó chỉ lấy các điểm ở trong vòng tròn hoặc lấy theo vùng
đệm của đường, của điểm.
Việc lấy mẫu phi không gian hoặc không gian có thể được thực hiện một
cách ngẫu nhiên hoặc có hệ thống. Trong trường hợp lấy mẫu hệ thống thì sự phân
bố điểm không thể là ngẫu nhiên. Ví dụ: muốn nghiên cứu điều kiện xã hội ở vùng
ngoại ô, một tập mẫu gồm 1000 hộ được phỏng vấn từ 200 tuyến điều tra. Đối với
mỗi tuyến việc điều tra có thể là ngẫu nhiên, song đối với toàn vùng thì sự phân bố
các điểm số liệu đó không được coi là ngẫu nhiên mà có thể là phân bố theo nhóm.
Tổ hợp không gian: trong phân tích mẫu điểm phân tích tổ hợp không gian là
phân tích mối quan hệ giữa cá yếu tố điểm và một loạt các yếu tố khác. Trong tổ
hợp không gian, các điểm phải được giới hạn trong các yếu tố polygon để tiện so
sánh đánh giá, ví dụ nghiên cứu bằng các kỹ thuật giật lùi (Regression
Techniques), các bước tiến hành cụ thể như sau:
• Bước đầu tiên là xác định các đơn vị địa lý, các đơn vị này được chia theo
các hệ thống chú giải thích hợp.
• Khoảng cách giữa các điểm.
• Bước thứ ba: phân loại các nhóm điểm căn cứ vào các thông số phân tích
được.
• Bước thứ tư: chồng xếp các lớp thông tin điểm và polygon.
• Bước thứ năm: phân tích kết quả chồng xếp và tính toán dự báo.
• Bước cuối cùng: kiểm tra đánh giá kết quả phân tích và kết quả dự báo.
• Phân tích phân bố điểm trong HTTĐL là quá trình quan trắc sự phân bố
theo nguyên tắc thống kê, kiểm tra sự sắp xếp trong không gian của các đối tượng
điểm và phân tích đặc điểm phân tích đặc điểm phân bố không gian của các mẫu
điểm bằng phương pháp xử lý thông kê mối quan hệ không gian. Ngoài ra, trong
nghiên cứu về điểm, HTTĐL cũng yêu cầu việc lựa chọn và lấy mẫu điểm theo
những nguyên tắc phù hợp với các yêu cầu xử lý không gian.
BÀI TẬP
1 - Căn cứ theo bảng sau so sánh các mẫu không gian dựa theo hệ số gần gũi
(NNIS)
a b a b
2 4 5 2 4 4 5
4
6 6 6 6
7 7
7 7
5 5
1 3 1 3
1 3 1 3
2 2
2 - Xác định xem 3 kiểu phân bố ở phía dưới sơ đồ sau là kết quả của phân
bố ngẫu nhiên hay không - sử dụng phân tích chia 4 của poisson để phân tích.
3 - Tính hệ số Marran cho 3 kiểu phân bố điểm thể hiện trong phương trình
trên (của câu 2), so sánh các giá trị.
4 - Số hoá các điểm phân bố trong hình dưới, xác định toạ độ x và y của các
điểm (sử dụng chức năng addxy) trong ARC/INFO để tạo toạ độ. Trường hợp
không có toạ độ thì đưa tạo độ tương đối thay thế. Trên cơ sở toạ độ, xác định giá
trị thống kê của trung tâm điểm và độ lệch chuẩn cho toạ độ x và y và mô tả mẫu
phân bố không gian. Tính toán hệ số NNIS của phân bố.
VI.PHÂN TÍCH ĐƯỜNG

Đường trong cơ sở dữ liệu của HTTĐL được chia làm hai loại chính. Đường
tự nhiên (physical line) và đường ý nghĩa (virtual line). Đường tự nhiên là loại
đường có thể nhìn thấy được trên ảnh máy bay hoặc ảnh vệ tinh, ví dụ: đường sắt,
đường bộ, sông suối, … các yếu tố dạng tuyến. Còn đường ý nghĩa ví dụ như
đường ranh giới quốc gia, ranh giới chính trị, đường ranh giới lưu vực ... Trong cơ
sở dữ liệu dạng Raster cũng có các đối tượng là đường, song thực chất đó vẫn là
những chuỗi pixel, có diện tích. Trong HTTĐL, đường là vector và việc phân tích
đường là phân tích yếu tố line trong vector. Trong bản đồ đường cũng chiém một
không gian nhất định và xuất hiện với những dạng và qui mô tập trung khác nhau
(mẫu khác nhau).
VI.1.Đo mật độ đường
Đường là yếu tố vector có kích thước và hướng nên việc phân tích có phức
tạp hơn điểm. Để đo mật độ đường, phương pháp đo cũng được thực hiện tương tự
như đo điểm. Các phép đo đạc mật độ đều được tính với đơn vị là m hoặc km trên
một đơn vị diện tích. Ví dụ: ha, m2, km2…rong ngành địa lý, mật độ đường được
tính cho nhiều yêu cầu khác nhau ví dụ : tính giá trị chia cắt ngang của địa hình-
mật độ lưới sông, mật độ kênh mương, mật độ đường giao thông…
VI.2.Đo đạc khoảng cách đến các đường gần nhất
Trong việc đo đạc về đường cũng giống như đo điểm cũng có khái niệm và
phương pháp đo đạc về các đường gần nhất hay khoảng cách đến các đường gần
nhất (Nearest Neighdedistance between Line).
Khoảng cách đến các đường gần nhất cũng được đo tương tự như đo khoảng
cách đến cá điểm gần nhất, song có phức tạp hơn vì đường có chiều dài.
Phương pháp đơn giản nhất là chia đôi đường, xác định điểm ở giữa và từ
điểm đó xác định các đường lân cận. Tuy nhiên đường thẳng có nhiều kích thước
khác nhau và cũng không phải đường đều là thẳng nên việc xác định như vậy
không cho bức tranh thực về sự sắp xếp của đường. Vì vậy một cách làm phổ biến
là lấy một điểm bất kỳ trên đường và từ đó xác định các lân cận. Nếu đường chia
làm nhiều đoạn thì lấy từ những điểm bất kỳ trên đoạn để so sánh. Bước tiếp theo
là vẽ những đường vuông góc tới các đường lân cận, tiến hành đo khoảng cách và
lấy giá trị trung bình của các khoảng (hình) (theo Davis 1986). Để chứng minh cho
giá trị đó là đứng thì phải chứng minh rằng đó không phải là phân bố ngẫu nhiên
(Dacey 1967) đã tính các giá trị: khoảng cách gần nhất tới cá đường lân cận, độ
lệch dự kiến và sai số thông thường (chuẩn) trong sự phân bố ngẫu nhiên của
đường. Các giá trị đó cho phép so sánh và chứng minh cho việc đo đạc đó không
phải là ngẫu nhiên. Phép tính đó sẽ sát thực tế nếu độ dài của đường phải lớn hơn
hoặc ít nhất bằng 1,5 lần khoảng cách giữa các đường và trong trường hợp các
đường không đổi hướng nhiều quá. Nếu số đường quá ít thì có thể áp dụng nguyên
tắc lấy yếu tố trọng số của (n-1)/n và giá trị mật độ đường điều chỉnh này sẽ giúp
định lượng về thống kê các đường gần nhất.
(n − 1) / L
Wf =
nA
Ở đây: L là độ dài các đường
A: diện tích khu vực
Wf: giá trị trọng số
Phương pháp đường cắt chéo: là phương pháp phối hợp để nghiên cứu sự
phân bố của đường. Một cách đơn giản chuyển mẫu hai kích thươcs sang kiểu
phân bố tần số 1kích thước bằng cách kẻ một đường thẳng trên bản đồ và xác định
các điểm giao nhau giữa đường đó với các đường đối tượng cần nghiên cứu. Có ít
nhất là 2 cách làm trong phương pháp này (theo Gefis, 1978). Cách thứ nhất là lựa
chọn một cách ngẫu nhiên hai đIểm các toạ độ rồi nối với nhau thành đường. Cách
thứ hai là vẽ một bán kính từ cách lựa chọn ngẫu nhiên. Từ đỉnh nhọn của góc, đo
khoảng cách tới đIểm trung tâm rồi vẽ đường vuông góc với đường bán kính tại
điểm đó (Davis 1986).
Sau khi có các điểm giao cắt, tính thống kê đơn giản về tần số điểm. Một
trường hợp khác của đường đơn là tạo đường ziczac, nó có thể cắt qua các đường
thẳng hai hoặc nhiều lần. Trường hợp đó người ta gọi đường ziczac là đường
ngẫunhiên (random walk). Đường ngẫu nhiên sẽ tạo nên một loạt các giao điểm và
phương pháp tính thống kê cũng áp dụng như khi áp dụng cho các đối tượng điểm.
Sau khi áp dụng việc thống kê đường gần gũi nhất hoặc thống kê đường giao
cắt, ta có thể đưa ra kết luận là phân bố không phải ngẫu nhiên và chứng minh cho
phân bố đó khác với phân bố ngẫu nhiên. Tóm lại, dùng hai phương pháp trên có
thể xác định được quy luật phân bố của các yếu tố đường, từ đó có thể đánh giá
được các đối tượng hoặc các hiện tượng tự nhiên hoặc nhân tạo.
VI.3.Nghiên cứu hướng của đường và các đối tượng dạng kéo dài
Các đối tượng dạng tuyến có thể được biểu hiện trong tự nhiên với nhiều
kiểu mẫu khác nhau: các lớp trầm tích, các tầng băng hà, … đường phố, rừng cây
thẳng bị đổ … Hướng của các yếu tố dạng tuyến thường có liên quan đến một hàm
số về năng lượng, ví dụ hướng cây đổ liên quan tới hướng nước chảy, hướng phân
bố trầm tích băng hà cũng liên quan tới hướng chuyển động của băng tuyết … Tất
nhiên không phải tất cả đều có quy luật như vậy.
Nhìn chung, sự phân bố của yếu tố dạng tuyến là có hai kích thước (xét riêng
và phương vị) hoặc có 3 kích thước (nếu xét thêm cả góc nghiêng trên mặt cầu).
Phương pháp thông dụng để xác định hướng của đường là chuyển tài liệu về
bản đồ các đối tượng đường sang sơ đồ hoa hồng. Trên sơ đồ, tâm của hình tròn là
điểm xuất phát của mọi đưòng tròn và mỗi quan trắc được vẽ thành một đường
đơn, xuất phát từ tâm điểm đó. Trong sơ đồ hoa hồng, độ dài của các đường biểu
hiện cho biên độ (chẳng hạn tốc độ gió) hoặc độ dài của đối tượng đường và góc
của đường là biểu hiện hướng phương vị của các đối tượng đường. Để lập sơ đồ
hoa hồng, cách tốt nhất là đo trực tiếp các giá trị đó trên bản đồ (góc và độ dài).
Trong HTTĐL, phép phân tích và xử lý đó gọi là vector kết quả.
Ta có thể xác định giá trị trung bình của hướng θ bằng vector kết quả. Vì giá
trị trung bình của hướng vector không chỉ phụ thuộc vào hướng của các cây mà
còn phụ thuộc vào số lượng các cây (số lượng quan trắc), vì thế cần làm tiêu chuẩn
hoá giá trị hướng cho toàn vùng bằng cách chia giá trị toạ độ vector kết quả cho số
lượng cây (số lượng đường). Giá trị đó cho phép so sánh các quan trắc trong các
vùng khác nhau và có thể kết luận là gió ở các vùng có cùng hướng hay không.
Cũng tương tự như với mẫu điểm, giá trị trung bình xác định cho độ hướng
tâm của tư liệu hay hướng của các điểm là tập trung xung quanh một vài điểm ở
trung tâm, với tốc độ gió biểu thị bằng vector, ta cũng có thể áp dụng nguyên tắc
thống kê đó để xác định xem tốc độ cũng dao động xung quanh một giá trị trung
bình hay không.
Khi các vector thành phần nằm rất gần với nhau thì vector kết quả R rất dài
và khi các vector thành phần có sự phân tán theo các hướng khác nhau thì vector
kết quả ngắn hơn. Tương tự như trường hợp 3 người muốn kéo một vật khi họ
đứng cùng một phía hay gần nhau hơn thì lực mạnh hơn, ngược lại 3 người nằm ở
3 góc khác nhau thì lực tập trung sẽ yếu hơn. Như vậy, khi thống kê về vector,
không phải chỉ có đo hướng độ dài là đủ mà còn phải đo độ nén (compactress) của
vector nữa. Nguyên tắc chung là độ nén cao thì vecto r R dài và độ nén thấp thì R
ngắn.
Trong phân tích vector kết quả R, cần phải thống kê tiếp để đưa ra giá trị
vector kết quả trung bình R bằng cách chia R cho số lượng quan trắc n. Giá trị R
thường dao động từ 0 đến 1, giá trị đó cũng thể hiện cho sự phân tán của các
đường xung quanh giá trị trung bình. R lớn thì các đường gần hướng với nhau
hơn, còn R nhỏ thì các đường nằm phân tán theo nhiều hướng khác nhau. Nếu
trong trường hợp có giá trị khác với trật tự quan trắc, ta có thể lấy giá trị 1 - R gọi
là chỉ số khác biệt vòng tròn (circularr varianc) để so sánh tốc độ tăng của vector
R. Nếu xét về mặt thống kê, ta có thể một số khả năng là có sự tương tự về hướng
cho các giá trị: độ lệch chuẩn, mode và trung bình.
Còn một vấn phải nghiên cứu về đường là hướng các đường. Một đối tượng
đường thường có hai hướng ngược nhau. Khi đó vector trung bình sẽ có giá trị
bằng 0 vì các vector triệt tiêu lẫn nhau. Để xử lý những giá trị ngược nhau về
hướng đo, Krmbein (1939) đưa ra một cách đơn giản để xử lý là nhân đôi góc đo
được. Ví dụ có hai góc 3150 và 1350 là hai trị số đo được cho một đường nếu lấy
điểm gốc để đo khác nhau.
Nhân đôi các giá trị đo được ta có:
3150 * 2 = 3600 và (6300 - 3600 = 2700)
1350 * 2 = 2700
Giá trị góc đo 2700 nay sẽ được dùng để tính thông số: giá trị trung bình của
vector, giá trị khác biệt vùng tròn ... Các thông số này có giá trị đường tăng 2 lần,
để lấy giá trị góc thực của đường, chỉ việc chia 2 (nghĩa là 2700: 2 = 1350 là góc,
v.v…)
Những phép đo về hướng và độ phân tán cần được thử nghiệm cho phân bố
ngẫu nhiên hoặc cho các phân bố đặc biệt để so sánh và khi tính cần tính theo lý
thuyết chuẩn.
Những phương pháp này được trình bày kỹ ở nhiều cuốn sách khác của các
tác giả như: Bastcheler 1965, Gumbel et al 1953, Slephen 1969, Gaile and Burt
1980, Mardia 1972…). Thông thường HTĐL cung cấp khả năng đo đạc đơn giản
để giúp ta hiểu được đặc điểm phân bố bên trong các thuộc tính của đối tượng
hoặc giúp ta so sánh được với các thuộc tính của đối tượng khác và phát hiện các
nguyên nhân hoặc nguồn ngốc tạo nên đối tượng. Các HTTĐL có khả năng cao
hơn, cho phép tính toán thống kê về hướng một cách trực tuyến hoặc chuyển tà
liệu nguyên thuỷ từ hệ thống sang phần mềm thiết kế đặc biệt cho những phân tích
này. Cũng cần phải thấy rằng việc đó sẽ tăng số lượng phần mềm cần thiết trong
xử lý, đặc biệt là khi ứng dụng vào địa học.
Hệ thống phần mềm xử lý Raster thường không thích hợp cho những phân
tích này, còn đa số phần mềm xử lý Vector trên cơ sở hình học thì ít nhất cũng cho
được một số những phân tích ban đầu (ví dụ góc của các đường hoặc đoạn thẳng).
Những số liệu đó có thể lưu trữ trực tiếp trong cơ sở dữ liệu như những giá trị
thuộc tính để từ đó có thể chuyển tiếp sang các phần mềm khác.
VI.4.Mô hình sức hút (gravity model)
Trong hệ thống đường, một yếu tố cần nghiên cứu đó là sự tác động qua lại
giữa các điểm nút. Ví dụ ở thành phố thì điểm nút là nơi quảng cáo, xây dựng cửa
hàng buôn bán … và giữa các nút có tác động qua lại, những thông tin cần được
xử lý là mật độ, khoảng cách giữa các điểm nút. Ngoài ra kích thước các điểm nút
cũng rất quan trọng. Tuy nhiên ở trong GIS ta quan niêm nút là có cùng kích
thước, để nghiên cứu vấn đề đó, một mô hình được đưa ra gọi là mô hình lực hút
(hay lực hấp dẫn) giữa các điểm (gravity model).
PiPj
Lij = K
d2
Ở đây: Lij là tương tác giữa các nút
Pi: biên độ nút i
Pj: khoảng cách của nút j
d: khoảng cách giưa các nút i và j
K hằng số liên hệ trong công thức, liên quan đến đối tượng nghiên cứu (ví
dụ: dân cư, động vật, nước…). Giá trị P được thể hiện bằng lực tương tác giữa các
điểm, có liên quan đến yêu cầu của sản phẩm (chẳng hạn liên quan đến tổng số
hàng bán được hay liên quan tới năng suất của hệ sinh tháikhi nghiên cứu việc câp
nước qua mạng sông suối). Nếu chỉ số hút (hấp dẫn) lớn giữa các nút thì sự tương
tác giữa chúng sẽ lớn hơn và ngược lại.
Những phần mềm HTTĐL có khả năng tính được chỉ số hấp dẫn với dữ liệu
của Raster và Vector.
VI.5.Vạch tuyến đi và phân định vị trí (Rounting andallocation)
Một trong những ứng dụng có ích nhất của nghiên cứu mạng lưới đó là vạch
đường đi và phân định vị trí. Vạch đường đi nghĩa là tìm đường đi ngắn nhất giữa
hai điểm bất kì trong mạng lưới. Tuyến đi có thể là giữa một điểm tới một điểm
gần nhất có trọng số cao. Vì các điểm nối có thể được gắn thêm trọng số như là
trong mô hình hấp dẫn.
Hình 45. Phân tích mạng để xác định đường đi từ điểm S tới điểm cuối
Mỗi đường trong mạng cũng có thể xác định thêm một giá trị đó là giá trị cản
hay giá trị khó khăn cho lưu thông (giống như điện trở trong mạch điện -
impedance value). Giá trị này có thể liên quan đến nhiều thông số như tốc độ giới
hạn trên một đường phố, tốc độ nước chảy… Bằng cách sử dụng khoảng cách tổng
hợp và giá trị cản, tuyến đi thích hợp nhất có thể được tìm ra, tuyến đi đó không
nhất thiết là đường đi ngắn nhất. Toàn bộ viêc đo đạc đó được thực hiện dọc theo
bề mặt, và các thông số phải đo đạc là khoảng cách tính chất của bề mặt, các nơi
giao cắt và các điểm nối khác. Giá trị về trọng số và sự cản trở nhiều khi phụ thuộc
vào nhận định cảm tính hơn là những giá trị được xác định trực tiếp.
Việc lựa chọn tuyến đi có thể được thực hiện trên dữ liệu Raster và khi đó
việc biểu thị tuyến đi dễ dàng hơn ở Vector. Kết quả đưa ra có thể kà nhiều tuyến
đi được vạch ra, đặc biệt là khi có những đoạn đi vòng.
Việc phân định vị trí hay chia vòng được áp dụng nhiều trong thực tế, ví dụ
phân vùng tưới tiêu, vùng quan trắc lửa cháy trong rừng, vùng buôn bán trong
thành phố, vùng cấp nước. Để xác định viêc phân chia đó, các thông số về khả
năng đáp ứng phải được đưa ra. Mỗi đường trong HTTĐL phải có một giá trị nhất
địnhthể hiện cho nội dung phân định. Ví dụ trong đường phố, mỗii đường phải có
thông số về số nhà mà cần phải cung cấp nước từ trung tâm (trong nước cấp nước)
hoặc số hộ dân hoặc số người cần có nhu cầu mua bán (trong nghiên cứu thị
trường).
Phương pháp xác định giá trị có thể đánh số từ 0 đến 100 (chẳng hạn mỗi
phố có khoảng cách tới siêu thị khác nhau) có thể đánh số gần nhất là 10 (do nhà
là 1 số). Nếu mọi thông số là giống nhau thì việc phân chia là rất đơn giản. Có thể
đưa ra nhiều ví dụ áp dụng việc phân chia vùng, chẳng hạn đưa thư báo trong
thành phố, đưa học sinh đi học.
Hình 46. Mô tả đường đi thuận lợi trong mmo hình cấu trúc raster
Có thể thấy rằng, về thông tin một lớp, có loại thông tin chính cần được xử lý
là vùng (area), điểm (point) và đường (line). Những tính chất cần được xác định về
các thông tin đó là sự phân bố, sự liên hệ và định hướng.
VII.CÁC BỀ MẶT THỐNG KÊ

Ở các phần trên, các đối tượng của HTTĐL đã được giới thiệu bao gồm
vùng, điểm và đường. Một nội dung quan trọng khác cần được nghiên cứu đó là sự
sắp xếp, liên hệ của các đối tượng trong không gian 3 chiều - đó là các bề mặt.
Những đặc điểm của các bề mặt cần được nghiên cứu phân tích và xử lý đó
là độ dốc, hướng dốc, hướng bóng nhìn (viewshed) và các đối tượng đặc biệt của
bề mặt như thung lũng, đồi, mạng lưới thuỷ văn. Ngoài ra cần phải định các bề
mặt đó là liên tục hay tách biệt nhau, nhẵn hay gồ ghề, tự nhiên hay nhân tạo.
Trong việc tạo lập các bề mặt trong HTTĐL, cần phải xem đến cơ sở ban đầu.
Trong việc nghiên cứu bề mặt, yếu tố hình học là hết sức quan trọng vì tính chất
đó tồn tại ở mọi vị trí, mọi điều kiện của bề mặt, ta gọi bề mặt đó là liên tục.
Những bề mặt đó thường gặp trong việc đo sâu, đo nhiệt độ, độ ẩm … Một số
trường hợp trong tự nhiên lại gặp những bề mặt không liên tục. Để tạo lập những
bề mặt như vậy, việc đo đạc hoặc lấy mẫu phải được thực hiện một cách tương
ứng. Nếu bề mặt liên tục thì việc lấy mẫu hay đo đạc có thể thực hiện tại một số vị
trí mà thôi, song nếu bề mặt không liên tục phải lấy mẫu cho toàn bộ vùng trong
cùng một thời điểm. Phương pháp lấy mẫu được áp dụng phải đưa ra kết quả là
đưa ra lưới điểm mẫu để xử lý tiếp tạo nên các đường Contonr về mặt hình học,
những đường đó thể hiện cho sự phân bố của bề mặt trong thực tế. Nếu bề mặt là
không liên tục thì phải có phương pháp phát hiện và bổ sung mẫu cho những chỗ
còn thiếu.
Thông thường, mẫu điểm thường có cả hai thông tin về vị trí và thuộc tính
nên HTTĐL không thể xử lý đồng thời các thông số đó mà phải chuyển về dạng
thông tin theo ô mạng hay đường Contour.
Các phần mềm HTTĐL được xây dựng nhằm tạo nên các bề mặt, thường là
các phần mền ứng dụng để nghiên cứu các hiện tượng tự nhiên như: nghiên cứu
nước chảy, nghiên cứu ô nhiễm … Các mô hình tính toán thường có thể liên hệ
chuyển đổi cho các phần mềm HTTL. Các chức năng cơ bản của các phần mềm đó
là: phương pháp thể hiện mẫu số (hay số liệu đo), tạo lập các bề mặt, tính toán các
giá trị bề mặt. Cùng với thời gian sự phát triển của các công nghệ đI đến tạo ra
những bước tiến cao hơn trong nghiên cứu bề mặt.
VII.1.Khái niệm về bề mặt
Thông thường bề mặt được đặc trưng bởi các giá trị độ cao “z” phân bố trong
một khu vực bao gồm một tập hợp các cặp toạ độ x và y. Giá trịz được quan niệm
là giá trị độ cao của bề mặt, song không nhất thiết nó chỉ có một đơn vị đo. Các
giá trị đó có thể là tính chất (ordinal), phân khoảng (interval) hay phân chia thứ
bậc (ratio data scales). Bề mặt được gọi là bề mặt thống kê (Satistic suface) khi
giá trị z là giá trị thống kê về biên độ của một đối tượng hay một hiện tượng được
xem xét (Robinson 1995), chẳng hạn mật độ dân số, thống kê lương, áp suất thuỷ
tinh, mức độ ô nhiễm…
Bề mặt liên tục là bề mặt có các trị số về độ cao biến đổi một cách từ từ giữa
các điểm nằm kề nhau. Bề mặt cách biệt là bề mặt có những khác biệt lớn ở một sô
vị trí liền kề nhau. Bề mặt liên tục có sự biến đổi rất ít về giá trị các điểm, gọi là bề
mặt nhẵn, còn bề mặt có các giá trị thay đổi nhanh thì gọi là bề mặt nhám.
Việc tạo thành các bề mặt như vậy là do giá trị mẫu quyết định vì thế việc lấy
mẫu là hết sức quan trọng trong nghiên cứu bề mặt.
VII.2.Lập bản đồ bề mặt thống kê
Bề mặt thống kê được chia làm nhiều loại: lập bản đồ điểm (dot mapping),
chroplethic mapping, dasy metric mapping và sarithic mapping. 3 loại đầu thuộc
về việc tạo các bề mặt cách biệt, còn loại thứ 4 được hiểu là lập bản đồ đường
Contour, nghĩa là tạo các đường có cùng giá trị độ cao. Quá trình kết nối các điểm
để tạo nên đường có cùng giá trị độ cao gọi là đường đồng mức( isarithm).
Hình 47. Các đường đồng mức độ cao trên mmô hình nổi 3D
Nếu nhìn từ đỉnh thì các đường có cùng giá trị xuất hiện gần như song song
với nhau. Nếu chúng chạy vòng quanh các đối tượng địa hình như đồi, thung lũng
thì các đờng đó sẽ khép kín, hoặc sẽ tiếp tục chạy vòng xung quanh đối tượng đến
mép bản đồ. Các đường cùng giá trị đó (đường đồng phức) giúp ta hình dung được
hình dạng các đối tượng hoặc các trạm trổ chính trên bề mặt đối tượng: đường
sông núi, thung lũng … Ngoài ra dựa vào khoảng cách giữa các đường có thể dự
đoán về độ dốc của địa hình. Một số phần mềm xử lý vector cho phép dễ dàng tạo
nên các đường đồng mức như vậy.
Lấy mẫu cho bản đồ thống kê
Để tạo lập bản đồ các đường đẳng trị, tại liệu phải được thu nhập từ các vị trí
điểm. Để lấy mẫu điểm, trước hết phảI lấy mẫu với mật độ … bằng hệ thống ô
lưới bằng nhau, phổ biến là tạo lưới với ô hình tam giác.
• Với bề mặt nhẵn, lấy mẫu theo nguyên tắc lưới đều.
• Với bề mặt nhám, phải lấy mẫu theo nguyên tắc tạo lưới không đều. Ở
những vị trí có sự thay đổi lớn của độ cao z phải lấy mẫu dày hơn.
Mô hình độ cao số (Digital Elevation Model-DEM)
Khi đã có tư liệu tại các mẫu điểm, công việc tiếp theo của việc xây dựng bề
mặt đó là việc mô tả hình độ cao số bằng các phần mềm HTTĐL. Qua trình đó có
thể thực hiện với cơ sở dữ liệu vector (TIN model trong ARC/INFO) hoặc cơ sở
dữ liệu Raster (image model).
• Dữ liệu đưa vào xử lý có thể là điểm, là đường hoặc vùng, với các giá trị
độ cao khác nhau. Trong quá trình xử lý, các dữ liệu đó được bố trí thành các điểm
riêng biệt với các giá trị độ cao khác nhau. Quá trình đó được gọi là tạo ra ma trận
độ cao tách biệt (discrete altitude matrix). Ma trận này là ma trận đều (iregular
lattice).
• Ma trận độ cao tách biệt được đưa vào xử lý trong mô hình độ cao số.
Một công việc quan trọng của tạo mô hình đó là nội suy (interpolation). Nội suy là
công việc tính độ chênh cao giữa các điểm và khoảng cách giữa các điểm trong
mạng lưới, từ đó tính được toàn bộ giá trị độ cao của ma trận. Đó là qúa trình bổ
sung giá trị độ cao cho toàn vùng. Công việc này có thể được áp dụng để lập bản
đồ độ cao tỉ lệ 1:250 000 với ô lưới là 63,5 mét hoặc tỉ lệ lớn hơn khi phân tích đo
lập thể ảnh máy bay.
Hình 48. Mô phỏng hai kiểu bề mặt địa hình dạng Raster và Vector
Với tư liệu Raster, bề mặt dược chia thành những đơn vị nhỏ gọi là ô lưới
(cell), mỗi ô lưới có một giá trị độ cao riêng. Như vậy tại liệu lirn tục được tách
thành những phần riêng biệt, mỗi phần đó là một ô lưới và mỗi ô chiếm một không
gian nhất định của bề mặt (hình 10.4 trong sách). Muốn có độ chính xác cao về độ
cao thì bề mặt Raster phải được chia thành các ô nhỏ hơn và đó là tương quan tỉ lệ
thuận.
Trong bề mặt Raster, một điều cần chú ý là giá trị z được xác định cho vị trí
nào của ô lưới. Thông thường là ở vị trí giữa ô, song cũng có thể ở 4 góc. Từ đó
cũng có thể xác định tiếp các giá trị khác nhau như: khoảng cách, độ dốc, hướng
dốc.
Hình 49. Các phương thức tạo bề mặt và phân tích bề mặt
Hình 50. nội suy các ô lưới giá trị để tạo bề mặt có độ cao khác nhau
Trường hợp bề mặt không nhẵn thì nhiều ô bị thiếu dữ liệu, nên phải bổ sung
dữ liệu về độ cao. Quá trình đó được gọi là quá trình nội suy (interpolation).
Các phương pháp nội suy
Về nguyên tắc nội suy là công việc dựa trên một nguyên tắc rất đơn giản
song lại yêu cầu có những giả định ưu tiên.
Trước hết hãy quan sát tần số xuất hiện về mặt toán học của dãy số sau:
12345678910
Trongdãy số đó, mỗi số tiếp sau hơn số đằng trước một giá trị là 1. Tần số
như vậy được gọi là tần số tuyến tính hoặc tần số số học vì nó tăng thêm mỗi lần
cùng1 giá trị, giá trị thêm vào là 1.
Với một dãy khác: 10 20 30 40 50 60 70 80 90 100 thì 10 là giá trị gia tăng
của mỗi bước hoặc với dãy số sau:
1000 900 800 700 600 500 400 300 200 100
thì 10 là giá trị giảm đi của mỗi bước. Tương tự như vậy biến đổi các số có
thể là theo nguyên tắc nhân, chia…
• Nội suy tuyến tính (linear interpolation)
Với những dãy số trên, nếu có những giá trị bị mất thì ta có thể dễ dàng bổ
sung nếu tìm ra được quy luật của dãy số, đó là quá trình nội suy theo tuyến tính.
Phương pháp làm là vẽ đường vuông góc cắt qua đường 100 và 150 rồi chia
thành 5 đoạn, từ đó bổ sung các điểm và giá trị còn thiếu và vẽ các đường Contour
qua các điểm bổ sung đó.
Tuy nhiên, việc nội suy theo tuyến tính chỉ thực hiện được trong những ví dụ
hẹp và bề mặt là liên tục và nhẵn. Thông thường độ chính xác của phép nội suy
theo tuyến tính là không cao vì trong thực tế mối liên quan về giá trị độ cao của
các điểm thường theo những hàm toán phức tạp hơn.
• Nội suy không tuyến tính (Nonlinear interpolation)
Nội suy không theo tuyến tính được thiết kế để áp dụng cho những trường
hợp được coi là không tuyến tính. Trong kỹ thuật nội suy không tuyến tính có 3
phương pháp chính là: trọng số (weighting), mặt phẳng hướng (Trend surface) và
Kriging. Đã có nhiều sách viết khá kỹ về vấn đề này, nên ở đây chỉ đề cập những
vấn đề chính.
• Phương pháp nội suy trọng số (Weighting interpolation method)
Tiếp cận của phương pháp này là mỗi vị trí trên bề mặt có những tính chất
hình học tương tự như của những điểm ở gần, đặc biệt là về độ dốc. Để hình dung
rõ khái niệm này, ta lấy ví dụ của trường hợp đi lên dốc và đi xuống dốc. Khi lên
dốc ta có cảm giác về độ cao các điểm ở gần là giống với độ cao vị trí ta đang
đứng, cảm giác đó sẽ rất khác khi so với các điểm ở xa. Khi xuống dốc, cảm giác
đó cũng tương tự. Khi xuống tới đáy dốc, ta cũng có cảm giác độ cao thay đổi đột
ngột.
Hình 51. Cách nội suy theo nhièu hướng để tính các yéu tố trắc lượng hình thái
Để thể hiện chính xác hơn địa hình, ta lựa chọn từ các điểm đã biết giá trị độ
cao ta nội suy để từ đó biết các giá trị độ cao của một điểm lân cận ở giữa tạo nên
một bề mặt của địa hình. Có nhiều phương pháp để nội suy: tạo một khoảng cách
hoặc một đường tròn có tâm là các điểm. Các điểm này được lựa chọn từ các điểm
mẫu hoặc lựa chọn số … nhất định các điểm trong các ô lưới vuông hoặc ô hình đa
giác – nghĩa là chọn một điểm cho một ô để nội suy. Với bất kỳ phương pháp nào,
máy tính cũng phải đo khoảng cách giữa mỗi cặp điểm từ mỗi nhân của ô hay từ
một điểm xuất phát. Độ cao của mỗi điểm được xác định bởi bình phương của
khoảng cách. Vì vậy nếu các điểm ở gần nhau thì giá trị tính được sẽ chính xác
hơn. Về nguyên lý là như vậy song trong thực tế áp dụng, có nhiều cách khác
nhau: có phương pháp áp dụng để giảm bớt số lượng các điểm đo, có phương pháp
tạo trọng số hơn là tính bình phương, có phương pháp tạo các gờ như đường bờ
biển, vách núi… để quá trình nội suy không vượt qua được. Phương pháp tạo gờ
cho phép nội suy từng vị trí riêng biệt. Trong nhiều phương pháp thì phương pháp
hay được áp dụng nhất là tạo các hướng trong bề mặt có độ cao z hơn là những
phương pháp cho cục bộ từng khu vực.
Bề mặt hướng thường được áp dụng cho một khu vực nhất định. Một mặt
phẳng độc nhất thường được tạo nên bởi các phương trình toán hoạ như:
polynominal hay spines. Các phương pháp này cho phép tính không tuyến tính mà
theo quan hệ đường cong hoặc những quan hệ số học khác. Để tạo lập nên mặt
hướng (trend surface), các trị số trong vùng được tính sao cho phù hợp với phương
trình toán học. Giá trị đơn giản nhất là tính cho các nhân kernel, từ đó tính cho
toàn vùng để tạo nên mặt phẳng. Giá trị của các nhân ô lưới (Kernel) có thể đơn
giản là trung bình của các giá trị trong vùng mà hướng đI qua, hoặc có thể lấy
trọng số giữa chúng tuỳ theo khoảng cách. Thông thường mặt phẳng hướng là rất
nhẵn và nó thể hiện toàn hướng cho tất cả mọi giá trị của đối tượng hoặc nó có thể
biểu thị một quan hệ phức tạp giữa các thuộc tính của đối tượng. Kiểu công thức
được sử dụng sẽ xác định số lượng những phần lượn sóng ở trên bề mặt. Mặt
phẳng hướng đơn giản thường có độ dốc nhỏ và có một hướng và gọi là bề mặt
trường mức độ thứ nhất. Nếu bề mặt hướng có hai hướng thì được gọi là bề mặt
trường mức độ thứ hai.
Phương pháp nội suy Kriging: Đây là phương pháp tối ưu để nội suy dựa vào
cách tính toán thống kê của bề mặt (Oliver 1990). Kriging sử dụng khái niệm về
sự khác biệt có tính chắt vùng (Blais và Carier 967, Matheran 967) với sự khác
nhau từ nơi này sang nơi khác song vẫn có sự liên tục. Đặc điểm này không thể tạo
lập mô hình được theo nguyên tắc của phương trình toán học tạo bề mặt nhám đơn
giản. Trong thực tế, hiện tượng này rất phổ biến đối với các đối tượng tự nhiên.
Chẳng hạn như các trường phân bố quặng, chất lượng đất và ngay cả trong thực
vật học cũng có hiện tượng phân bố như vậy.
Kriging tạo lập nên bề mặt phức tạp với 3 giá trị riêng biệt:
• Giá trị thứ nhất được gọi là độ lệch (hoặc sự trôi dạt) hay cấu trúc của bề
mặt, giá trị này tạo một bề mặt cơ sở như một trường trong một hướng bất kỳ.
• Giá trị thứ hai được đưa ra nhằm tổng hợp những sự khác biệt nhờ trong
bề mặt chung, ví dụ như những chỗ nhô lên hoặc lõm xuống nhỏ trong bề mặt,
chúng xuất hiện ngẫu nhiên song lại có quan hệ với một khoảng không gian khác.
Công việc này được gọi là tự động hoá liên hệ không gian.
• Giá trị thứ 3 là giá trị để chỉnh lý những nhiểu ngẫu nhiê không có liên
quan tới hướng chung cũng như tự động liên hệ không gian Clarke (1990) đã minh
hoạ cho ý nghĩa của giá trị nàybằng hình tượng tương tự là: nếu ta leo núi, sự thay
đổi địa hình theo hướng nhìn lên từ điểm khởi đầu đến đỉnh núi đựpc gọi là độ trôi
dạt hay cấu trúc của bề mặt. Dọc đường trèo ta gặp nhiều chỗ lồi lõm cục bộ xuất
hiện ngẫu nhiên song vẫn có liên hệ chặt vơí độ cao của địa hình. Đôi chỗ ta thấy
có những tảng đá dốc đứng. Hiện tượng đó được gọi là nhiễu về độ cao bởi vì
chúng không có liên hệ trực tiếp với bề mặt. Cấu trúc ở phía dưới do độ cao của
chúng thay đổi đột ngột ngay từ trí đầu tiên gặp chúng.
Ba phương pháp nội suy đã nêu ở trên được thực hiện một cách độc lập.
Phương pháp trôi dạt (drifit) sử dụng phương trình toán học thể hiện sự thay đổi
chung trên bề mặt và gần giống như mặt hướng (trend surface). Độ cao dự kiến
được đo bằng kỹ thuật đồ thị thống kê gọi là Semivenogram. Đồ thị này chấm các
khoảng cách giữa các mẫu gọi là Lag(h) (sự tụt hậu) của độ cao, trên trục nằm
ngang. Trục thẳng đứng có các giá trị nửa khác biệt (semivaince), giá trị này là 1/2
sự khác biệt (tính bằng bình phương của độ lệch chuẩn) giữa mỗi giá trị độ cao của
một điểm lân cận. Giá trị này là một trị số của sự phụ thuộc lẫn nhau về giá trị độ
cao, nó liên quan đến sự ở gần xa giữa chúng.
Đặc điểm thứ 3 quan trọng của đồ thị bán khác biệt (semivariogram) này là
đường cong chuẩn, không chạy trực tiếp qua điểm gốc. Cả thuật toán và cách tiếp
cận đều xuất phát từ ý nghĩa là nếu không có sự khác biệt và giá trị sẽ làcủa 1
điểm mà thôi. Vị trí đường cong chỉ là tương đối nên sự khác biệt giá trị 0 ở trong
sơ đồ và các giá trị đương dự kiến chỉ là sự giả định cho việc xuất hiện những
nhiễu khác biệt không có sự liên hệ, các nhiễu đó gọi là sự khác biệt chi tiết
(nugget variance). Sự khác biệt đó là sự tổng hợp những sai số đo cùng với những
sai số không gian xuất hiện ở những điểm có khoảng cách ngắn hơn so với khoảng
cách của mẫu và những nhiễu đó là không xử lý hết được (Theo Bourrongh 1986).
Ba thông số vừa nêu ở trên của phương pháp sơ đồ bán khác biệt là rất quan
trọng cho việc xử lý nội suy cho khu vực. Khi nội suy cho từng vùng phải tính
thêm giá trị trọng số. ở đây việc lựa chọn trọng số là phải nhằm loại bớt những sự
khác biệt có thể có cho mối liên hệ tuyến tính về độ cao của tệp mẫu. Giá trị này
có thể xác định được tiếp từ mô hình tạo đồ thị bán khác biệt (semivariogam) của
toàn khu vực.
Phương pháp Kriging có 2 dạng chính:
• Dạng chung hay tổng quat (general Kriging) còn được gọi là universal
Kriging: là phương pháp hay được sử dụng nhất khi tạo mặt phẳng dự kiến cho
những mẫu có sự phân bố không đều (irregular) hay còn gọi là không ổn định.
• Dạng ngắt đoạn (Punctage Kriging) là dạng ban đầu được áp dụng với
quan niệm là số liệu ổn định (không có hướng) đồng nhất và phân bố trong không
gian đều. Phương pháp này chủ yếu là dùng để nội suy các số liệu điểm khác hơn
là để tạo bề mặt.
Kriging là một phương pháp nội suy chính xác giúp cho việc đo đạc đúng
những giá trị độ cao bị mất, nó còn có ưu thế là tính nhanh và tính đúng. Nó còn
có ưu điểm hơn so với các phương pháp nội suy khác là nó không chỉ nội suy các
giá trị nội suy mà nó còn xác định được tổng số những lỗi trong kết quả. Tuy
nhiên trong trường hợp những lỗi do đo đạc quá nhiều thì Kriging khó tính được
sơ đồ khác biệt và khi đó Kriging cũng thực hiện không tốt hơn các phương pháp
khác.
Tuy nhiên, mỗi một phần mềm HTTĐL đều cung cấp ít nhất là một phương
pháp nội suy để xử lý số liệu độ cao. Trong HTTĐL sử dụng dữ liệu Vector, mô
hình TIN thường giúp ta trình bày dễ dàng những điểm có cùng giá trị và tổng hợp
các giá trị độ cao của chúng, chuyển thành ma trận điểm về độ cao (đôi khi gọi
đơn giản là số liệu điểm).
Từ số liệu của ma trận điểm, có thể lựu chọn dễ dàng các phương pháp nội
suy để tạo mặt phẳng. Đối với các phần mềm sử dụng tài liệu Raster thì các số liệu
điểm được biến đổi thành các số liệu của các nhân và các nhân bị thiếu số liệu sẽ
được tính và gán cho theo nguyên tắc nội suy từ các nhân kế cận. Nếu như phần
mềm không có mô đun xử lý thích hợp, ta có thể biến dổi số liệu để xử lý trong
phần mềm chuyên dùng về nội suy. Kết quả tạo được đó lại được chuyển về phần
mềm ban đầu để xử lý. Giới thiệu chung về nội suy có một só sách của các tác giả
như Lan (1983) hay Flowerdew và Grean (1992).
Ứng dụng của nội suy
Ngoài các kỹ thuật nội suy đã nêu ở trên còn có các kỹ thuật khác như tạo
bóng, tạo hướng dốc … Tuy nhiên, công việc đó chỉ thực hiện được một khi các
phần mềm có các chức năng đó.
Trong thực tế, khi nào thì cần làm nội suy? Đó là vấn đề đặt ra của việc ứng
dụng. Có thể đưa ra một vài ví dụ tham khảo sau:
• Xác định các vùng ngập với tần số xuất hiện là 100 năm, trong điều kiện
chưa có bản đồ để tham khảo, biết rằng mức ngập là cao 100 m trên mực nước
biển. Kết quả sẽ giúp cho việc lập các khu định cư cho an toàn. trong số liệu chỉ có
một giá trị độ cao nhất định đã có từ trước khi xây dựng nhà cửa. Bằng phương
pháp nội suy, có thể bổ sung số liệu cho các điểm khác trong khu vực từ đó lập ra
được các đường đồng mức, trong đó có đường 100, chính là ranh giới cần xác
định.
• Mở rộng đường giao thông trong trường hợp không có bản đồ, phải mở
đường trên cơ sở lựa chọn hướng dốc thích hợp. Nội suy sẽ giúp lập được bản đồ
độ cao, bản đồ độ dốc và bản đồ hướng dốc.
• Trong tìm kiếm các vỉa quặng, ta chỉ có một số liệu về độ cao xuất hiện
giả đáy và rtần thân quặng, bằng việc nội suy tạo được một bề mặt có độ dốc thân
quặng khác với bề mặt che phủ bên trên. Từ đó có thể xử lý tiếp để tính toán toàn
bộ quy mô của thân quặng. Hoặc dễ hiểu và đánh giá về chất lượng các vành phân
tán quặng, từ số liệu mẫu từ các điểm sẽ nội suy để tạo ra các đường đẳng trị về
hàm lượng mẫu.
Tóm lại trong nghiên cứu địa lý, nội suy được áp dụng để xác định các vùng
trên bề mặt có giá trị z khác nhau. Giá trị z đó có thể là hàm lượng Nitơ trong đất,
mức độ phát triển của thực vật từ một nguồn cung cấp độ ẩm, mật độ dân số ở các
vùng, mức độ ô nhiễm môi trường từ một số nguồn phát thải. Phương pháp nội suy
cung cấp khả nămg cần thiết trong việc xử lý số liệu nhằm phục vụ cho nhiều nội
dung nghiên cứu khác nhau của khoa học địa lý, địa chất và môi trường.
Một số vấn đề cần quan tâm trong nội suy
Trong việc nội suy, có 4 vấn đề cần phải được quan tâm đến là:
- Số lượng các điểm khống chế (có số liệu).
- Vị trí của các điểm khống chế.
- Các vấn đề về điểm uốn (điểm tạo các số đất).
- Diện tích có các điểm tài liệu.
Nói chung, có thể thấy một điều rõ ràng là nếu số lượng mẫu có nhiều thì kết
quả nội suy sẽ chính xác hơn và kết quả sẽ gần đúng nhất với thực tế. Tuy nhiên,
vấn đề đặt ra là số lượng mẫu tối thiểu là bao để đủ cho việc nội suy. Mặt khác
trong thực tế cũng cho thấy nếu qúa nhiều mẫu thì việc xử lý sẽ mất nhiều thời
gian và cũng chưa phải là có kết quả tốt hơn. Đôi khi quá nhiều mẫu lại dẫn đến
xuất hiện nhiều mẫu hoặc sai số. Kết quả là mặt phẳng tạo được tượng tự nhiễu, do
đó kết quả là không chính xác.
Đặc điểm của đường cong lý thuyết về sự liên hệ giữa số lượng điểm và độ
chính xác của bản đồ nội suy (với bản đồ isarathmic) tạo các đường đẳng trị. Vị trí
các điểm mẫu thường có tác động rất nhạy cảm tới kết quả nội suy. Khi mà tập
mẫu điểm của một sự phân bố tương đối bằng phẳng thì đơn giản nhất là sử dụng
phương pháp trung nhân tâm (centroid – of – cell method). Khi đó, phần mềm cho
phép tạo lưới và xác định các nhân để gắn giá trị. Còn với phân bố theo vùng hoặc
không bằng phẳng thì phải áp dụng phương pháp nội suy theo các tâm trọng số
(centre of gravity method). Cả hai phương pháp đều hay xảy ra trường hợp là có
một số tâm điểm lại nằm ngoài các vùng nghiên cứu, đặc biệt là trong trường hợp
phân bố không đều thì cách đơn giản là nhấc những điểm nhân đó vào trong vùng,
ở vị trí gấn nhất có thể được. Những thao tác này thường được áp dụng một cách
linh hoạt trong xử lý.
Các điểm sống đất (tạo yên ngựa): Đôi khi gọi là các điểm xen kẽ, xuất hiện
khi hai cặp giá trị z ngược với nhau, tạo nên một góc vị trí của giao điểm có giá trị
lớn hơn hai giá trị của một cặp điểm thứ nhất và nhỏ hơn giá trị của một cặp điểm
thứ hai. Việc nội suy nhằm tìm và gắn giá trị α cho điểm đó-điểm ấy được gọi là
điểm yên ngựa. Điểm này hay gặp trong việc nội suy theo khoảng cách. Khi vấn
đề điểm sống đất xuất hiện, phần mềm máy tính thường đưa ra hai cách giải quyết
thích hợp để tạo nên contour. Cách đơn giản nhất là lấy giá trị trung bình của 4
điểm ở bốn góc và đặt vào giao điểm để nội suy.
Hình 52. Bảo đồ độ cao địa hình và mô hình 3D với dữ liệu là đường đồng mức
(Phần ngoài rìa bị nhiễu do không có số liệu)
Vấn đề cuối cùng cần được xem xét trong nội suy đó là những vùng nằm bên
trong của số liệu mẫu điểm. Để việc nội suy có kết quả hoàn hảo, trong tập số liệu
phải có những điểm khống chế. Thông thường, nếu ta lựa chọn vùng nghiên cứu
có cùng diện tích với cùng nội suy, ta phải xử lý nội suy cho những điểm ngoài rìa
của vùng. Khi đó sẽ có một số hướng của điểm khống chế bị phân rìa ngăn chặn
nếu không có số liệu độ cao ở phần ngoài. Trong việc nội suy, kết quả sẽ tốt nếu
có được đầy đủ các điểm lân cận xung quanh điểm khống chế. Trong trương hợp
thiếu thì thuật toán sẽ làm cho kết quả bị lệch xiên đi so với đường biên và như
vậy phần lớn kết quả ở vùng biên sẽ không chính xác. Trong trường hợp tính toán
độ dốc, hướng dốc, độ cao … đều gặp lỗi ở phần biên.
Để khắc phục tình trạng đó, giải pháp tốt nhất là lựu chọn vùng nghiên cứu
nhỏ hơn và nằm gọn trong vùng được nội suy. Thông thường vùng được nội suy
phải có diện tích lớn hơn vùng nghiên cứu khoảng 10%. Để thực hiện điều đó, sau
khi nội suy ta phải cắt bớt vùng nội suy một cách chính xác để có được đúng kết
quả nội suy cho vùng nghiên cứu
Cắt lớp bề mặt thống kê (Slicing Statistical Surface)
Phương pháp phổ biến để thực hiện bề mặt là tạo đường đồng mức giá trị độ
cao. Các khoảng cao đều giữ các đường đồng mức cho khả năng hình dung được
hình dạng của bề mặt. Tuy nhiên, cần lưu ý rằng khoảng giữa các đường đồnh
mức thì địa hình có sự thay đổi liên tục về giá trị độ cao. Vì khoảng cao đều được
lựa chọn phải thể hiện được tốt nhất diện mạo của địa hình. Đa số các phần mềm
HTTĐL cả Raster và Vector đều có khả năng chuyển đổi các đườngđồng mức
hoặc bề mặt đường đồng mức lên mặt phẳng nằm ngang nhằm thể hiện tính liên
tục của bề mặt địa hình. Kỹ thuật đó được gọi là kỹ thuật cắt lớp - giống như dùng
một con dao sắc cắt ngang bề mặt. Cắt lớp đơn giản là lựa chọn những khoảng cao
đều nhau để cho phép nhìn và phân biệt rõ các đặc điểm khác nhau của bề mặt –
nghĩa là có thể lựa chọn khoảng cách thẳng đứng giữa các đường đồng mức là lớn
nhất song không làm mất đi những hình dạng chính cả địa hình. Cắt lớp giúp có
được hình ảnh chung của mặt phẳng hướng mà không cần xử lý tạo bề mặt hướng.
Thông thường, để nhìn chi tiết các đặc điểm trên bề mặt, ta phải lựa chọn khoảng
cao đều giữa các đường nhỏ đi. Tất nhiên công việc đó chỉ có ý nghĩa thực tiễn
một khi số lượng mẫu điểm và phương pháp nội suy đã hoàn hảo.
Nói tóm lại thì bề mặt thống kê là kiểu bề mặt được xây dựng từ hệ thống
mẫu điểm và các giá trị mãu có thể rất đa dạng. Các giá trị mẫu đó được quy định
là giá trị z (độ cao) của các điểm. Từ các giá trị đó, các phương pháp nội suy cho
phép thành lập nên các bề mặt thống kêvà các bề mặt thống kê có thể là liên tục
hoặc tách biệt.
Có những phương pháp nội suy và việc áp dụng tuỳ thuộc vào tính chất của
hệ thống mẫu điểm Kriging là phương pháp nội suy có tính chất ưu việt nhất cho
phép tạo lập được bề mặt sát thực nhất.
Bề mặt thống kê và phương pháp nội suy cho phép tạo ra nhiều loại bản đồ
ứng dụng khác nhau như bản đồ các đường đồng mức, bản đồ độ dốc, hướng dốc,
hướng bóng… Với những thuật toán chung có ở trong phần mềm HTTĐL, song
việc ứng dụng là rất đa dạng trong nhiều lĩnh vực của địa học.
1.1. CÁC PHÉP PHÂN TÍCH KHÔNG GIAN CƠ BẢN TRONG

HTTĐL
Ở phần trên chúng ta đã nghiên cứu những vấn đề cơ bản của HTTĐL: cấu
trúc cơ sở dữ liệu, bản chất của từng kiểu dữ liệu, các kỹ thuật phân tích dữ
liệu…Tuy nhiên, trong thực tế áp dụng, ta cần hệ thống hoá để lựa chọn quy trình
và các mô hình thích hợp. Chương này có mục tiêu hệ thống hoá những kỹ thuật
cơ bản hay áp dụng trong HTTĐL, đồng thời cung cấp phương thức tiếp cận để
giải quyết những vấn đề phức tạp, nhằm từng bước giải quyết các mục tiêu đặt ra
của đề án nghiên cứu.
Các phép toán logic
Các phép toán logic tập trung vào 2 dạng: đại số dãy và đại số Boonle.
• Các phép logic đại số
Nguyên tắc chung là:
Out put =if… Then … Otherwise
(bản đồ kết quả = nếu…thì, nếu không …thì …)
Các phép đại số được sử dụng bao gồm các phép tính chủ yếu là bằng, lớn
hơn, nhỏ hơn và tổ hợp khoảng (lớn hơn và nhỏ hơn) và áp dụng cho cơ sở dữ liệu
chuẩn (SQL: standard query language). Về ý nghĩa, các phép logic đại số được áp
dụng để xử lý bản đồ với mục đích là:
- Xác định giới hạn của nước đơn vị bản đồ cần tìm trong một lớp bản đồ
(các đơn vị đó thường là polygon, từ đó tạo ra một lớp bản đồ mới với những đơn
vị được lựa chọn).
Ví dụ: trong bản đồ có 20 lớp có ID từ 1-20. Có thể lựa chọn các lớp bản đồ
mới với các phương án khác nhau, chẳng hạn: chỉ lấy các đơn vị bản đồ có ID > 8,
như vậylớp mới sẽ gồm các đơn vị polygon có ID tư 8-20 mà thôi. Tương tự như
vậy, có thể tạo một lớp bản đồ mới bao gồm các polygon có giá trị trong khoảng
>8 và < 15… (có nghĩa là lớp bản đồ chỉ có các đơn vị từ 8 đến 15).
- Lựa chọn tách biệt một số giá trị để tạo nên một lớp bản đồ mới với hệ
phân loại mới.
Vẫn ví dụ trên: với một bản đồ cóc 20 lớp tư 1- 20, ta có thể sắp xếp lại một
cách lựa chọn, ví dụ đổi thành 10 lớp hoặc 12, 15 lớp. Như vậy, một số polygon sẽ
được đổi ID theo sự lựa chọn mới. Các phép logic đại số có thể được áp đụng
trong xử ký thông tin vector của một lớp, song dễ dàng sử dụng hơn cả là cho
thông tin Raster của một hay nhiều lớp bản đồ.
• Các phép logic đại số Boolean
Các phép toán logic đại số loolean bao gồm AND, OR và NOT (chương trên
đã giới thiệu cho khả năng với hai lớp A và B, sẽ có 4 phương án chồng xếp nhau
với cơ sở dữ liệu SQL:
A AND B, A OR B, A NOR B, A NOT B
Kỹ thuật này có khả năng xử lý các tàI liệu địa lý, địa chất, môI trường, đặc
biệt là trong việc đánh giá và quy hoạch lãnh thổ.
Ví dụ: có hai bản đồ đánh giá A – cho trồng rừng và B là cho trồng trọt. Khi
chồng xếp bản đồ sẽ có những khu vực mà hai polygon sẽ chồng lên nhau. Khu
vực chồng lấn giữa hai lớp polygon một cách chính xác trên lớp bản đồ kết quả.
Khi trong thực tế nghiên cứu, có những thông tin phức tạp cần xử lý có thể
áp dụng đồng thời các phép toán logic nói trên.
Các phép xử lý số học
Các phép xử lý số học có thể áp dụng cho t liệu bản đồ và t liệu thuộc tính d-
ưới dạng bảng. Các phép tính được áp dụng bao gồm: cộng, trừ, nhân, chia, luỹ
thừa, căn, cosin, sin, tang, cotang, …(-, - ,*,/,n, , sin, cos, tang, cotan,…). Các
phép toán này có thể áp dụng cho rất nhiều mục khác nhau. Cụ thể:
- Phân loại lại các lớp đơn vị bản đồ: đất, sử dụng đất, thực vật, rừng, …
chuyển đổi đơn vị diện tích (ha, m2…)
- Chuyển đổi thuộc tính của các đơn vị bản đồ: ví dụ chuyển đơn vị độ dài
đường đi thành đơn vị thời gian phải đi … Kết quả sử dụng trong các bài toán quy
hoạch giao thông.
- Tính toán các giá trị hình học: tính khoảng cách, mật độ, tính khối lượng
(đất đá, nước hoặc rừng…).
- Ngoài ra, một số phép tính thống kê cực đại, cực tiểu, thuộc về, trung
bình độ lệch chuẩn, độ lệch chung, tạo đồ thị … cũng được áp dụng để xử lý các
loại đữ liệu khác nhau.
Trong khi sử dụng các thuật toán để xử lý một hoặc nhiều lớp thông tin, cách
thể hiện các công thức và quá trình xử lý có thể khác nhau ở mỗi phần mềm. Ví dụ
xử lý để tạo lớp C từ hai lớp A và B có một phép toán như:
C = A - B, C = A – B, C = A/B, C = A * B.
Hoặc: if A > 100, C = 10. Otherwise C = 0.
nghĩa là: nếu A> 100 thì C=10, còn lại C= 0
(các giá trị 100, hoặc 10 là ID của từng đơn vị bản đồ)
Điều hành thông tin bản đồ theo bảng thuộc tính
Bảng thuộc tính là dạng lưu giữ chính của cơ sở dữ liệu trong thống kê. Theo
nguyên tắc cấu trúc phân nhánh và mạng lới thì bảng thuộc tínhlà khâu tổng hựp
cuối cùngcủa một nhánh của một hệ thống cơ sở dữ liệu. Bảng thuộc tính cũng đợc
dùng trong quá trình xử lý phân tích và chồng xếp thông tin của các lớp bản đồ.
Tuỳ theo mô hình của hệ thống lu trữ và xử lý mà bảng thuộc tính loại. Khái
quát chung, có hai loại bảng chính:
Điều hành bảng thuộc tính của một lớp thông tin:
Đây là bảng thống kêcác thông tin của một lớp. Bảng này đợc gọi làbảng một
chiều(one dimention table). Cấu trúc của bảng bao gồm hàng và cột.
- Hàng thường thể hiện các đơn vị của bản đồ.
- Cột thuộc tính có thể có nhiều cột về tính chất của đối tượng, chẳng hạn:
màu sắc, toạ độ X, Y, độ dài, diện tích, chu vi và các giá trị thống kê khác của đối
tượng.
- Hàng thể hiện các đối tợng có trong bản đồ; số thứ tự về hàng được quy
định theo nguyên tắc phân chia nhóm ID. Ví dụ với bản đồ sử dụng đất: 1 – lúa, 2
– rừng, 3 - đất trống…
Ngoài số cột mang tính chất thống kê về hiện tại các tính chất của đối tượng
còn có các ô để bổ sung và điều chỉnh tính chất của đối tượng.
Bảng thuộc tính một chiều, ngoài việc thống kê tính chất của đối tượng, còn
có thể được sử dụng để phân loại bản đồ (reclassfication). Với việc điều chỉnh, bổ
sung các thuộc tính mới cho các đơn vị, bảng được đưa vào trong khâu xử lý để
biến đổi bản đồ ban đầu thành một bản đồ mới với các thuộc tính được điều chỉnh.
ví dụ: Bản đồ sử dụng đất hiện tại có 10 lớp:
1 2 3 4 5 6 7 8 9 10
Điều chỉnh theo bảng thành các lớp mới:
2244667799
Kết quả bản đồ chỉ còn 5 lớp: 2 4 6 7 9
Ngoài việc phân loại lại, bảng cũng được dùng để điều chỉnh cách thể hiện
bản đồ về màu sắc, mẫu của các đối tượng bản đồ.
Ở bảng hai chiều, hàng và cột thể hiện cho từng đối tượng và giá trị thống kê
của chúng trong mối quan hệ về không gian khi chồng xếp hai lớp thông tin.
- Theo đường chéo của bảng tính từ gốc, các ô giá trị thể hiện sự giữ
nguyên vị trí trong không gian trong phần diện tích của đối tợng.
- Các ô khác thể hiện phần diện tích giữa các đơn vị của hai lớp bản đồ.
- Cuối mỗi hàng và cột, có giá trị H tổng diện tích của tng đơn vị bản đồ
cũng sử dụng bảng hai chiều có thể áp dụng nghiên cứu chuyên dề nh: phần sự
biến động theo thời gian của các lớp thông tin, phân tích độ chính xác của bản đồ
…
- Đặc biệt bảng hai chiều có thể sử dụng để điều hành thông tin khi chồng
xếp hai lớp bản đồ, vẽ lại ranh giớ của các đơn vị khi chồng xêps hoặc phân loại
lại trong quá trình chồng xếp thông tin của hai lớp.
Điều hành thông tin một lớp trong quan hệ lân cận (opertioanal on spatial
neighbonrhoods)
Trong HTTĐL, đặc biệt với cơ sở dữ liệu Raster (ảnh và các bản đồ nội suy),
nhiều thuật toán về tập hợp thống kê đợc áp dụng để xử lý và tạo nên những lớp
thông tin Raster mới. Một trong những thuật toán hay được áp dụng đó là các phép
lặp (fittering): lọc cho phép xử lý các thông tin hình ảnh (theo hàng và cột) để tạo
nên các hình ảnh mới, trong đó một số thông tin hoặc một nhóm thông tin đợc làm
tăng cường và được làm rõ các tính chất, đồng thời một số thông tin không cần
thiết có thể đợc làm lu mờ di hoặc loại bỏ và chuyển thành các thông tin khác.
Trong các khoa học về trái đất nhiều phép lọc được áp dụng cho những
nghiên cứu cụ thể như sau: làm nhẵn các đối tượng (smooth), loại bỏ những hướng
có tần số cao, làm nổi các đường biên của đối tượng, làm rõ một hướng cấu trúc
của đối tượng theo không gian, làm nổi rõ cấu trúc bề mặt đối tượng (hay độ nhám
của đối tượng). Đặc biệt, những áp dụng thật sự lý thú của các phép lọc là phục vụ
cho nghiên cứu về tính chất hình học của bề mặt như: tính toán và xây dựng bản
đồ độ dốc, bản đồ hướng dốc, bản đồ bóng núi và một số ứng dụng đặc biệt khác
như tính toán các bề mặt và dao động của mực nước ngầm.
Nguyên tắc của phép lọc là tạo một cửa sổ vuông (windows) với các giá trị
của từng ô cửa sổ đợc lựa chọn. Cửa sổ đó được gọi là tấm lọc (filter) (cernel,
temblate hay filter), tấm lọc đó ta di chuyển và xử lý cho toàn bộ ảnh nguyên thuỷ
theo nguyên tắc tính dồn (convolution). Quá trình tính convolution được thực hiện
theo nhiều phương pháp khác nhau.
Với lọc đơn giản nhất là cermel vuông với kích thớc 3*3 pixel. Kỹ thuật lọc
hay được áp dụng để xử lý thông tin ảnh vệ tinh: có các kiểu lọc khác nhau: lọc
thấp (lọc min) để làm in ảnh, lọc cao để làm nổi rõ các đường biên giới của các đối
tượng. Theo thực nghiệm xử lý mỗi filter đợc sử dụng những tấm loc chuẩn và có
tên riêng (ví dụ lọc lapia – lọc cao). Trong các phần mềm HTTĐL, trong một số
filter được tạo cố định song cũng có cả chức năng tạo lập các filter mới tuỳ theo ý
muốn của người sử dụng.
Các phép lọc để nghiên cứu các yếu tố hình học của bề mặt địa hình
• Tính toán hướng dốc
Hướng dốc là một tính chất hình học quan trọng của địa hình. Hướng dốc là
tần số và biên độ xuất hiện mặt dốc lớn nhất của địa hình theo một hướng nào đó.
Thông thường, hướng dốc được chia thành 5 hoặc 9 hướng cơ bản (hướng cuối
cùng là hướng nằm ngang). Để tạo bản đồ hướng dốc, kỹ thuật lọc được áp dụng
với filter 3*3 theo hai hớng chính Đông Tây và Nam Bắc, có hai filter là:
Áp dụng z filter để lọc hình ảnh bề mặt độ cao đã nội suy từ các giá trị độ
cao (đường hoặc điểm), ta sẽ có giá trị độ dốc phát triển theo hai hớng x và y đó là
giá trị Theo phương trình tính độ dốc:
Z = a - bx - cy
S = b2 - c2
A = tan1(c /d)
ở đây:
Z là độ cao của điểm ở tâm filter
a, b, c: hằng số tính toán
x, y là toạ độ điểm
S: độ dốc (slope)
Kết quả lọc sẽ cho bản đồ độ dốc và bản đồ hướng dốc. Tuy nhiên, tuỳ từng
phần mềm và từng hệ số được áp dụng mà kết quả lọc có thể là khác nhau và đơn
vị của bản đồ cũng khác nhau. Để có kết quả chính xác, cần thiết phải kiểm tra và
chuyển đổi các đơn vị tính một cách phù hợp (độ tính theo radian hoặc độ góc).
• Tạo bóng cho địa hình
Kỹ thuật lọc có thể được áp dụng để tạo hình ảnh cấu trúc bề mặt địa hình
thông qua việc tạo bóng cho địa hình. Để tạo bóng phải xác định sự lộ sáng của địa
hình bởi một nguồn sáng có khoảng cách vô cực (chiếu song song), giống như
nguồn mặt trời. Các thông số cần xác định là: góc phơng vị của tia sáng ( α ), góc
thiên đỉnh (góc so với phương thẳng đứng) của nguốn sáng là phần lộ sáng được
tính là cosin của góc ϕ góc chiếu của tia.
Cosϕ = cos (độ dốc) x cos( α ) - sin (độ dốc) x sin ( α ) x cos ( α – hướng dốc)
Trong việc thành lập bản đồ hướng chiếu sáng, có thể áp dụng phương pháp
lọc cho bề mặt và sử dụng đặc điểm đường cong bề mặt để phân biệt ra các yếu tố
địa mạo như: thung lũng, đồi, vùng bóng, sông núi và vực hẻm.
Trong một phần mềm HTTĐL, các phép tính toán trên đợc xây dựng thành
các modul riêng biệt với những lệnh và điều kiện đơn giản để dễ sử dụng. Việc tạo
bóng núi theo hướng của mặt trời còn đợc phát triển thành tạo bóng theo hướng
nhìn. Những kỹ thuật này giúp cho khả năng nhìn địa hình theo nhiều hướng khác
nhau. Chức năng này cũng được kết hợp với các mô hình DEM để cho kết quả đ-
ược trình bày theo không gian 3 chiều, hình ảnh sẽ trở nên sinh động.
Trong phần này đã làm nổi bật HTTĐL, một phần mềm đủ mạnh thì nhất
thiết phải có những chức năng xử lý thông tin theo những mô hình toán học. Các
mô hình đó được xây dựng để tổng hợp hoặc tách chiết thông tin, sửa chữa và biến
đổi thông tin cơ bản thành những lớp thông tin mới. Quá trình xử lý có thể thực
hiện cho một lớp hoặc nhiều lớp thông tin.
Các phương trình toán học được áp dụng có thể rất đơn giản song cũng có
thể rất phức tạp. Tuy nhiên, để giúp cho việc ứng dụng được dễ dàng, các quá
trình xử lý được chuyển đổi thành những lệnh đơn giản. Trong qúa trình ứng dụng
người điều hành cần nắm rõ về bản chất của các thuật toán để từ đó lựa chọn các
thông số thích hợp đa vào xử lý. Mặt khác, điều đó cũng giúp ích cho việc kiểm tra
độ chính xác của kết quả xử lý.
1.2. GIỚI THIỆU VỀ CÁC THIẾT BỊ XUÂT NHẬP DỮ LIỆU

Một trong những mảng công việc rất quan trong của HTTĐL là nhập dữ liệu,
đó là công việc nhằm thiết lập các đối tượng và mối liện hệ giữa chúng trong thế
giới số. Nhập dữ liệu là công việc thiết lập và tập hợp tư liệu dưới dạng số nhằm
xây dựng nên một cơ sở dữ liệu, trong đó toàn bộ các bản đồ, các hình ảnh là các
bảng thuộc tính. Không gian được mã hoá và được xác định về mặt không gian.
Công việc này thường chiếm tới 75% về thời gian cũng như 75% về kinh phí
thực hiện của một đề án. Tất nhiên trong đó có cả việc bổ sung, chỉnh sửa dữ liệu
để tạo nên một cơ sở dữ liệu hoàn chỉnh.
Những nội dung cần thiết của việc nhập dữ liệu bao gồm: lựa chọn các nguồn
t liệu, lựa chọn lới chiếu bản đồ, số hoá, quét và chuyển đổi hệ thống toạ độ.
Các nguồn tư liệu có thể phân loại sơ bộ thành các loại: tài liệu nguên thuỷ
(gốc), tài liệu thứ cấp (tài liệu số hoặc không phải dạng số). Đại đa số các HTTĐL
sử dụng t liệu dạng thứ cấp nghĩa là những tài liệu đã đựoc thu thập từ trước, được
tổng hợp và lu trữ ở những nơi khác. Tài liệu thứ cấp thường bao gồm các dạng
như các bản đồ (không phải dạng số hoặc là dạng analog), các biểu bảng (dạng
giấy hoặc dạng số) vá các hình ảnh (dạng số là chủ yếu, nếu không có thì phải quét
tạo dạng số).
• Lựa chọn lới chiếu bản đồ: đây là công việc cần được sự quan tâm đầu
tiên của người sử dụng HTTĐL, nó cần phải được xác định và giải quyết trước khi
những công việc nghiên cứu bắt dầu. Mặt khác, lưới chiếu bản đồ luôn là vấn đề
được quan tâm đến trong suốt quá trình nhập dữ liệu, xử lý dữ liệu hiển thị và xuất
dữ liệu.
• Số hoá bản đồ: có hai phương pháp số hoá bằng tay và số hoá tự động.
Việc phát triển kỹ thuật quét và nhận dạng tự động đối tượng là một xu thế đã và
đang được phát triển trong HTTĐL.
• Chuyển đổi khuôn dạng dữ liệu: các dữ liệu số ban đầu có thể được xây
dựng từ những phần mềm khác nhau có khuôn dạng khác nhau, vì vậy việc chuyển
đổi khuôn dạng (format) là vần đề hết sức cần thiết. Trong việc chuyển đổi đó yêu
cầu là không biến đổi các thông tin cần thiết, hoặc có thể bổ sung, chỉnh sửa cho
phù hợp với HTTĐL đang sử dụng. Trong đó, việc chuyển hệ thống toạ độ là điều
quan trọng trước tiên (bằng các file coordinate – conversion). Việc chuyển đổi đó
có thể từ bảng toạ độ được thiết lập trong quá trình số hoá, có thể là từ toạ độ địa
lý sang lới chiếu quy định hoặc từ bảng toạ độ tuỳ ý sang một hệ toạ độ chuẩn đã
biết.
Như vậy, nhập dữ liệu là công việc cần phải được chuẩn bị và thực hiện chu
đáo trớc khi xử lý các mô hình. Với các phần mềm HTTĐL hiện đại thì việc xử lý
càng nhanh chong, chính xác một khi ta có cơ sở dữ liệu hoàn chỉnh.
• Các tài liệu nguyên thuỷ
- Có nhiều dạng bao gồm các tài liệu, bản đồ đo vẽ ngoài thực địa, các số
liệu đo đạc, mô tả, … đặc biệt những điểm lấy mẫu và quan trắc cần phải được xác
định rõ vị trí toạ độ bằng máy định vị vệ tinh GPS. Đối với ảnh máy bay và ảnh vệ
tinh, vị trí các điểm lấy mẫu và vị trí các đối tượng quan trắc ngoài thự địa cũng
phải được xác định rõ. Ngoài những ảnh chụp thực địa với những xác định về tỷ
lệ, thời gian chụp … cũng là những tài liệu nguyên thuỷ cần thiết.
• Các tài liệu thứ cấp
- Khi các tài liệu nguyên thuỷ được hệ thống hoá, phân tích, bổ sung thí nó
trở thành tài liệu thứ cấp song hết sức quan trọng. Đó là các loại bản đồ được biên
vẽ bản tác giả sau khi có tổng hợp tài liệu thực địa và chỉnh lý ngay tại thực địa.
Đối với các bản đồ ở cạnh nhau, phải có sự giáp nới ranh giới các khoanh vị một
cách liên tục.
Ngoài các tài liệu thứ cấp có thể là các số liệu hoăc bản đồ dạng số đã được
số hoá bởi các cơ quan khác. Tuy nhiên cũng cần lu ý đến khuôn dạng dữ liệu, nếu
không sẽ mất nhiều thời gian, để chuyển đổi cho tương thích với HTTĐL mà đề án
sẽ sử dụng. Nếu không lưu ý thì có thể tài liệu đó sẽ không sử dụng được.
Đối với một bản đồ chuyên đề, việc vẽ các đối tượng cần phải có sự phối hợp
chặt chẽ với yêu cầu dữ liệu trong HTTĐL để lựa chọn các ký hiệu hoặc các đ-
ường Contour hoặc vị trí các điểm một cách phù hợp. Ví dụ, để nghiên cứu tai
biến trượt lở, các vị trí trượt phải được thể hiện thành các vùng có ranh giới cụ thể,
nếu không thể hiện được thành vùng thì phải có những mô tả chi tiết.
Đối với những tài liệu khái quát hay tài liệu của tài liệu, được gọi là
metadata, nó cũng là một dạng tài liệu. Metadata thường giới thiệu về nguồn tài
liệu, nơi quản lý, người thành lập.
Khi thành lập các bản đồ thứ cấp, nhất thiết phải chú ý tới hệ lới chiếu của
bản đồ. Hệ lưới chiếu của bản đồ tài liệu nên cùng với lới chiếu của bản đồ sản
phẩm. Trong trường hợp không thể đáp ứng được thì phải chuyển đổi trong quá
trình xử lý.
Các thiết bị nhập dữ liệu
Rất nhiều thiết bị đã và đang được sử dụng cho việc nhập dữ liệu:
• Thiết bị đơn giản nhất song đã và đang được sử dụng là lới kẻ ô vuông
trên giấy nhựa trong. Lưới này được sử dụng để xác định vị trí nghiên cứu các đối
tượng theo toạ độ lới, sau đó nhập các dữ liệu vào máy tính. Trong công việc này,
cần lưu ý các vị trí đã được xác định và tính toạ độ nằm ở tâm hay ở góc của ô lới.
Trong khâu tổng hợp và nội suy các điểm thì những thông tin đó sẽ giúp cho việc
đánh giá độ chính xác của quá trình xử lý.
• Bàn số hoá: Đây là thiết bị và công việc phổ biến nhất của việc nhập dữ
liệu vì nó có khả năng cho nhập dữ liệu từ dạng không số vào dạng số Vector một
cách chính xác nhất. Bàn số có hai bộ phận chính là bàn số và chuột:
- Chuột (cursor) là thiết bị cho phép di chuyển một cách tự do trên bàn số.
Trong chuột có thiết bị cảm ứng từ và sự cảm ứng được thiết kế tương ứng với sự
chuyển động của cầu cao su. Thiết bị được bọc ngoài băgf vỏ nhựa, trên đó có các
nút điều khiển. toàn bộ thông tin vè vị trí được ghi nhận bằng tơng tác của chuột
và bàn số để tính độ chính xác của thông tin phụ thuộc vào độ nhạy cảm của thiết
bị và tốc độ di chuyển của chuột. Số phím của chuột và tính năng các phím phụ
thuộc vào đặc điểm của bàn số và phần mềm điều khiển chuột có thể có dây nối
với máy tính và bàn số, song cũng có thể là dạng không có dây.
- Bàn số: là bàn chế tạo theo nguyên tắc thống kê điện, tổ chức theo hệ
thống lưới. Kích thước của bàn được qui định cho vùng hoạt động có tín hiệu khi
di chuyển chuột trên bàn. Giá cả của thiết bị phụ thuộc vào độ chính xác của tín
hiệu, độ phân giải và kích thước của bàn số. Thông thờng, độ phân giải của bàn là
0,001inch. Độ chính xác của việc số hoá phụ thuộcvào số điểm khống chế. Số
điểm cần thiết tối thiểu là 3 điểm. Theo kinh nghiệm thao tác, các điểm này cần
lấy ở các góc của bản đồ hoặc cần thiết lấy ở ngoài khung nội dung nghiên cứu, nh
vậy, những thông tin trong quá trình số hoá sẽ được giữ đầy đủ.
Quá trình số hoá có thể thực hiện dới 3 dạng (mode) là điểm, đường cong
hoặc dòng (Stream). Với mode điểm, các vị trí ngẫu nhiên được xác định theo
từng điểm tuỳ theo từng núm điều khiển mà có thể đa vào các thuộc tính cho các
điểm đó. Với mode đường, đó là quá trình tạo nên hàng loạt các đoạn thẳng nhỏ
nối liên tục với nhau. Các đoạn thẳng này được hình thành do quá trình số hoá
từng điểm dọc theo tuyến. Với mode dòng thờng được số hoá cho các file dữ liệu
lớn. Trong quá trình số hoá có thể đa thuộc tính cho đối tượng, chỉnh các điểm nối
của Vector hoặc tạo các điểm nối mới, tạo polygon chỉnh sửa và thay đổi thuộc
tính.
Quá trình chỉnh sửa các đường Vector có thể thực hiện bằng tay hoặc chỉnh
sửa tự động. Một số chỉ tiêu để lựa chọn bàn số là: tính ổn định (stability), tính
tuyến tính (linearily), độ phân giải (resolution), độ lệch (skew) và độ nhạy, an
toàn. Để kiểm tra tính ổn định, ta có thể xem các đặc điểm số hoá có bị lệch khi
bàn số nóng lên, hoặc có thể số hoá lại 1, 2 lần một đối tượng rồi xem hình dạng
kết quả có giống nhau hay không. Các tính chất khác có thể kiểm tra ngay được
khi số hoá.
Kích cỡ của bàn số được quy định theo kích thước khổ giấy: loại kích thước
60x90 cm (khổ Al), hay 90x120 cm là loại bàn số được sử dụng phổ biến nhất.
Bàn số hoạt động theo sự điều hành của phần mềm, vì vậy cần lựa chọn phần
mềm HTTĐL có chức năng số hoá và hoạt động với những loại bàn số phổ biến.
Muốn bàn số hoạt động thì trớc hết nó phải được cài đặt các thông số tương ứng
với phần mềm điều hành.
• Máy quét bàn số (scanner): là thiết bị nhận dữ liệu dạng Raster phổ biến
nhất, nó hoạt động theo quy tắc quang học. Hiện nay máy quét được sử dụng nhiều
hơn bàn số ví nhiều ưu việt của nó như độ chính xác, tính ổn định, đa dạng. Với sự
tiến bộ về công nghệ điện tử và tin họcthì có khả năng nhận dạng, biến đổi dữ liệu
quét Raster thành dữ liệu Vector – vì vậy quét càng được ưa chuộng hơn trong
việc nhập dữ liệu.
Máy quét có thể cấu tạo theo nguyên tắc tròn quay (hình …) hoặc bàn quét
phẳng, nó đã được ứng dụng cho công tác bản đồ từ những năm 1960 (caritensen
va compbell 1990). Máy quét được thiết kế như một ma trận lớn của các giá trị số,
mỗi pixel của ma trận sẽ ghi nhận một giá trị độ sáng của hình ảnh có diện tích t-
ương ứng với pixel. Độ phân giải về phổ được thể hiện là giải sáng mà thiết bị có
thể phân biệt được cho mỗi pixel. Đa số các máy quét scanner có khả năng phân
giải là 8 bit (256 cấp độ sáng). Độ phân giải không gian của máy quét có thể thay
đổi từ 600 điểm trên 1 inch (dpi) (nghĩa là khoảng cách khoảng 42 micro) đến 200
dpi. Kích thước của máy quét cũng được gọi theo kích thước của khổ giấy của
vùng hoạt động quét. Máy quét cũng được thiết kế và hoạt động theo phần mềm
điều khiển. Máy quét có thể tách màu để quét riêng cho độ sáng của các màu cơ
bản (B, G, R).
Hạn chế lớn nhất của việc quét là dữ liệu đòi hỏi bộ nhớ lớn, hình ảnh thu
được ở dạng Raster nên toạ độ chỉ là hàng và cột. Muốn chuyển đổi vào CSDL
vector của HTTĐL thì công việc chỉnh sửa và bổ sung dữ liệu được thực hiện
bằng quá trình vector hoá và edit với những phần mềm riêng. Công việc đó cũng
sẽ tốn rất nhiều thời gian tương tự như việc số hoá bằng bàn số, song có thể đưa ra
kết quả chính xác hơn do được thao tác trực tiếp trên màn hình với hình ảnh quét
làm nền.
Máy quét được ứng dụng nhất trong những công việc chỉ đòi hỏi dữ liệu
raster, hình ảnh ví dụ: biên tập sách báo tạp chí, lập các trang Web, tạo ảnh nghệ
thuật. Trong kỹ thuật HTTĐL, máy quét cũng dần dần được sử dụng nhiều cùng
với sự phát triển của phần mềm có chức năng vector hoá mạnh.
• Nhập tài liệu theo bảng
Bảng là dạng tài liệu quan trọng của HTTĐL, bảng có thể là ở dạng nguyên
thủy hay thứ cấp. Bảng có thể là tài liệu gốc song cũng có thể là bảng thuộc tính.
Trong CSDL của HTTĐL, các bảng thống kê hoặc mô tả không theo những
quy định của phần mềm thì vẫn chỉ có tính chất như phần mô tả bằng lời để minh
hoạ cho các đối tượng. Những bảng như vậy không thể sử dụng điều hành thông
tin trong quá trình xử lý. Việc nhập dữ liêu dạng bảng là nhập các bảng thuộc tính
của dữ liệu vector hoặc raster. Cấu tạo của các bảng này phải theo quy định của
từng phần mềm, bảng thuộc tính có thể là bảng 1 chiều, bảng 2 chiều hoặc nhiều
chiều. Trong mỗi bảng, thông tin quan trọng cần được nhập vào đó là toạ độ của
đối tượng điểm vì thông thường bảng được sử dụng để nhập thuộc tính điểm, toạ
độ có thể được ghi theo toạ độ địa lý hoặc theo hàng, cột của dữ liệu lưới. Các
chiều khác của bảng là những thuộc tính của đối tượng. Trong khi nhập dữ liệu
bảng, phải lựa chọn phần mềm thích hợp để có thể dễ dàng chuyển đổi khuôn dạng
của bảng vào trong HTTĐL chính, phục vụ cho những xử lý tiếp theo.
Xuất dữ liệu
Phân tích xử lý là khâu mạnh và quan trọng nhất của một HTTĐL vì đó là
một quá trình xử lý biến đổi phức tạp theo những mô hình không gian. Trong quá
trình đó chúng ta thường ít quan tâm đến việc hiển thị những kết quả đã làm. Xuất
dữ liệu là công việc cuối cùng của bất kỳ một việc phân tích nào. nếu dữ liệu xuất
ra không được rõ ràng sáng sủa thì chúng ta đã làm mất đi rất nhiều chất lượng
công việc đã làm từ trước.
Trước hết, mục đích của khâu xuất dữ liệu là hiển thị các kết quả, đây không
phải là việc hiển thị bình thường mà phả là sự liên kết với kết quả nghiên cứu xử
lý của các khâu trước. Để có được kết quả tốt đẹp, khâu hiển thị và xuất dữ liệu
phải được đặt trong khái niệm thiết kế bản đồ số. đó là công việc có sự kết hợp
giữa kiến thức bản đồ và tin học. Tất nhiên trong công việc đó, các yếu tố mỹ
thuật cần thiết được áp dụng một cách hài hoà để sản phẩm xuất ra có hình thức và
chất lượng tốt nhất.
Hiển thị các kết quả phân tích
Hiển thị là công đoạn rất quan trọng trước khi in ấn hoặc lưu trữ kết quả. Có
một số công việc cần thực hiện trong hiển thị như sau:
• Thiết kế bản đồ kết quả
Phải xác định vị trí bản đồ, số lớp cần hiển thị, hệ thống ký hiệu, màu sắc, hệ
thống chú giải. Hệ thống ký hiệu phải lựa chọn các loại ký hiệu có sẵn trong phần
mềm phù hợp với nguyên tắc thể hiện của bản đồ truyền thống. Ví dụ có các bộ
màu ký hiệu cho bản đồ sử dụng đất, bản đồ địa chất, bản đồ lâm nghiệp … Trong
trường hợp cần thiết, phải thiết kế mới các ký hiệu.
- Chữ: Thiết kế chữ trên bản đồ kết quả là công việc cần làm hết sức cẩn
thận để nâng cao giá trị của kết quả nghiên cứu. Trong HTTĐL, lớp thông tin có
chữ như tên sông suối, địa danh … cần phải để riêng để khi cần thiết có thể chỉnh
sửa.
- Màu sắc: Việc chọn màu cũng phải dựa theo các bảng màu quy định.
Trong phần mềm, việc chọn màu được trợ giúp bằng các bảng tra màu.
Trong quá trình thiết kế, một nguyên tắc cần được thực hiện là phải có sự
liên hệ chặt chẽ và logic giữa kết quả nghiên cưú, bản đồ sản phẩm và hệ thống
chú giải. Mỗi một sự thay đổi về màu sắc và ký hiệu trên bản đồ phải được thay
đổi một cách tương ứng trên hệ thống chú giải. Vì vậy trong phần lớn các phần
mềm HTTĐL đều có chức năng tự động lựa chọn màu, ký hiệu hoặc tự động lập
bảng chú giải.
- Các lớp trên bản đồ sản phẩm: Cần xem xét số lượng các thông tin cần
thiết để đưa lên bản đồ kết quả, ví dụ trên bản đồ kết quả có thể có thêm các lớp:
địa danh, sông suối, đường đồng mức, đường giao thông, các điểm dân cư, các
điểm đặc biệt khác … Trong trường hợp đó các lớp thường ở dạng vector. Ngoài
ra, có thể bố trí thêm lớp thông tin nền là ảnh vệ tinh hoặc ảnh máy bay …
Khi cần thiết có thể chỉnh sửa những lỗi xuất hiện trong quá trình phân tích
xử lý: ví dụ có thể loại bỏ một số nhiễu cục bộ, một số sự xê dịch về vị trí giữa các
lớp thông tin…
Tóm lại: Việc thiết kế là công việc rất cần thiết, nó đòi hỏi sự kết hợp hài hoà
giữa nội dung của nhiều chuyên môn và tính mỹ thuật. Nếu thiết kế tốt thì sản
phẩm sẽ có thêm giá trị.
Tỷ lệ bản đồ
Không giống như việc trình bày tỷ lệ trên bản đồ giấy, ở bản đồ kết quả trong
HTTĐL việc thể hiện tỷ lệ bản đồ là công việc đòi hỏi sự tỷ mỷ và thử nhiều lần.
Thông thường, để tránh gặp sai sót thì tỷ lệ bản đồ được trình bày bằng thước tỷ
lệ. Để xây dựng thước tỷ lệ trên bản đồ kết quả dạng số, phải có động tác đo
khoảng cách giữa các vị trí đánh dấu trên màn hình và trên bản đồ giấy để so sánh
và xác định tỷ lệ tương ứng so với thực tế. Trên thước tỷ lệ, độ dài các đoạn tỷ lệ
phụ thuộc vào kích thước của nó trên màn hình.
In ấn kết quả
Kết quả của một quá trình xử lý HTTĐL được thể hiện ở các dạng chính:
• Các bảng biểu thống kê và các đồ thị
Trong quá trình xử lý thông tin trong HTTĐL, các kết quả đều được thống kê
thành các file số liệu một cách tự động. Vì vậy, trong kết quả, cần thiết phải lấy ra
một số bảng biểu để thuyết minh cho các sản phẩm bản đồ. Có nhiều dạng bảng
như: thống kê hệ thống toạ độ và thuộc tính của các đối tượng dạng vector hoặc
raster. Các kết quả phân loại và số liệu thống kê cho từng lớp được phân loại, các
giá trị toán học có trong các phương trình tính toán, các giá trị thống kê, các ma
trận. Tuy nhiên, các bảng biểu đó thường được xây dựng theo các quy ước về ký
hiệu trong từng phần mềm riêng. Vì vậy, để có kết quả dạng bảng biểu phù hợp
với nội dung của báo cáo tổng hợp, các bảng biểu cần phải được xử lý lại bằng
việc chuyển đổi một số tên gọi cho các thông số hoặc tính thêm một số thông số
mới: gộp nhóm, tổng, hiệu, min, max. Khi cần thiết có thể chuyển sang một phần
mềm khác để biên tập lại.
• In kết quả
Có nhiều kiểu máy in và mỗi máy in đều hoạt động dưới sự điều hành của
phần mềm HTTĐL.
- Máy in theo điểm (plotter): Theo nguyên tắc là mực in được đặt trong các
bút màu có đầu kim. Các bút màu được gắn với bộ phận nhận tín hiệu điện tử ở
trong máy. Khi có lệnh in, các thông tin cần in được chuyển thành các tín hiệu
điện từ, điều khiển hệ thống bút hoạt động trong khi giấy hoặc phim được gắn vào
trục chuyển động. Máy in chấm điểm có độ phân giải tối đa là 400 dpi, thường để
in bản đồ với hệ thống mẫu bên trong các polygon.
- Máy in laze: Nguyên tắc của máy in laze cũng tương tự như việc
photocopy. Dựa vào những thông tin số được cung cấp bằng lệnh điều khiển của
phần mềm, chùm tia laze có thể tiến hoặc lui dọc theo mặt trống cảm quang. Như
vậy trên mặt trống từ mỗi điểm bất kỳ đều có các phân tử nhạy cảm dương với tia
laze. Trống từ đồng thời sẽ được phủ bởi các hạt có nhạy cảm âm tạo nên dải nhạy
cảm độ sáng từ âm đến dương với các màu khác nhau. Giấy in được chuyển động
cùng với trống và những hạt rất nhỏ đã được tác động bởi ánh sáng sẽ in lên giấy
hoặc phim. Cuối cùng, dưới tác động của nhiệt hoặc áp suất thì các hạt có màu sắc
được gắn chặt vào giấy hoặc phim làm cho hình ảnh sẽ được ổn định.
Máy in laze có thể hoạt động cho việc in đen trắng hoặc in màu, tất nhiên in
màu sẽ đắt hơn. Độ phân giải của máy in laze dao động từ 300 – 600 dpi hoặc
nâng cao hơn có thể đạt tới 1200 dpi với giấy và 2400 dpi với phim. Thông thường
chế độ 300 dpi được dùng phổ biến để in các sản phẩm khổ lớn. Các chất làm mực
màu phổ biến là có khả năng nhạy cảm nhiệt. Thông thường, chế độ nhạy cảm
nhiệt được chế tạo tương ứng với chế độ màu của phần mềm điều hành, nghĩa là
có 256 cấp.
Như vậy, với 3 màu cơ bản và 1 màu đen nhìn chung các máy màu nhạy cảm
nhiệt là có khả năng tạo 16 triệu màu, rõ ràng về chất lượng là cao hơn hẳn so với
máy in chấm điểm.
Mỗi loại máy in có chế độ hoạt động khác nhau mặc dù nguyên lý chung là
giống nhau, do đố chúng đòi hỏi loại mực riêng. Vì vậy, khi in màu bắt buộc phải
có động tác in thử nhằm điều chỉnh một cách hệ thống, ổn định trước khi in chính
thức, nhất là đối với trường hợp in sản phẩm khổ lớn, chất lượng cao.
Lưu giữ kết quả dạng số
Sau mỗi đề án làm việc, các kết quả được in ra dạng giấy hoặc phim, song
cũng cần thiết được lưu lại dưới dạng số bằng việc ghi vào các đĩa mềm hoặc đĩa
CD-ROM.
• Đối với các dữ liệu vector, việc lưu thường không tốn nhiều bộ nhớ nên
tốt nhất là ghi dưới dạng file hoàn chỉnh dể các thông tin được giữ nguyên.
• Đối với các dữ liệu rastor (bản đồ, hình ảnh), việc lưu thường tốn nhiều
bộ nhớ. Với những file lớn, có thể cắt hình ảnh ra làm nhiều mảnh để ghi thành
từng đĩa mềm riêng (trong trường hợp không có máy ghi CD – ROM), thông
thường các hình ảnh được ghi dưới dạng nén. Tất cả các công việc như chia nhỏ
file hình ảnh, ghép, nén và mở nén đều đã được xây dựng thành các chức năng
riêng của một sô phần mềm thông dụng chạy trong chế độ window hoặc DOS.
1.3. THIẾT KẾ VÀ TRIỂN KHAI HỆ THÔNG TIN ĐỊA LÝ

Trong các chương trên, chúng ta đã đi vào nghiên cứu cách thể hiện các đối
tượng và các hiện tượng ở trong tự nhiên, xã hội vào dạng số và các phương pháp
nghiên cứu chung ở dạng số.
Những công việc cần giải quyết của HTTĐL nhằm đáp ứng nhiều vấn đề đặt
ra của các khoa học về địa lý, địa chất, môi trường, … không chỉ phục vụ cho
những người nghiên cứu mà quan trọng nhất là phục vụ cho những ai đặt ra câu
hỏi để chúng ta giải quyết.
Muốn thực hiện nhiệm vụ đặt ra cho một đề án xử lý HTTĐL, những việc
cần phải giải quyết là:
• Thiết kế hệ thống cơ sở dữ liệu.
• Xây dựng mô hình xử lý ở tỷ lệ lớn.
• Xử lý chính xác các thông tin với phương tiện thích hợp.
• Đưa ra các sản phẩm có tính thuyết phục cao.
Muốn vậy, phải có sự thiết kế và thực hiện một cách hoàn chỉnh và việc thiết
kế sẽ đóng vai trò hết sức quan trọng cho sự thành công của đề án.
Bên cạnh sự thiết kế thì thực hiện là khâu mấu chốt của quá trình xử lý
HTTĐL và việc chuẩn bị về năng lực con người, máy móc (phần cứng, phần mềm)
phải được đặt ra trước tiên, chúng ta sẽ xem xét từng vấn đề của cả quá trình thực
hiện.
Thiết kế HTTĐL
Ngay từ những năm 1960, vấn đề thiết kế HTTĐL đã được đặt ra cùng với sự
phát triển của các phần mềm xử lý vector và raster, một số hệ thống được xây
dựng trong các trường đại học hoặc viện nghiên cứu để phục vụ cho mục tiêu đào
tạo.
Trong quá trình hoạt động, một số hệ thống dần dần không đáp ứng được các
yêu cầu đặt ra của thực tiễn, mà lý do chính là sự thiết kế hệ thống dần dần trở nên
không được tương thích với yêu cầu. Trong đố nổi lên hàng đầu là các phần mềm
chưa đủ mạnh, ngoài ra cấu trúc phần cứng cũng trở nên lạc hậu, thao tác phức tạp
và cho ra những sản phẩm chất lượng thấp.
Hiện nay, với sự phát triển của công nghệ tin học và điện tử, nhiều thiết bị
mới hoàn thiện hơn được ra đời cùng với rất nhiều phần mềm khác nhau. Trước
thực tế đó, việc thiết kế một hệ thống thích hợp với từng mục tiêu sử dụng là một
công việc hết sức quan trọng.
• Lựa chọn các phần mềm thích hợp: hiện nay, các phần mềm mạnh thường
là các phần mềm thương mại. Việc lựa chọn một phần mềm phải căn cứ vào các
mục tiêu sau:
- Loại tư liệu cần xử lý: đó là tư liệu vector, raster hay tổng hợp.
- Các nội dung cần xử lý: Xử lý hình học cho từng lớp riêng biệt hay xử lý
tổng hợp nhiều lớp thông tin, xử lý theo mô hình không gian khối lượng thông tin
cần xử lý.
- Mục tiêu xử lý: để phục vụ cho nhu cầu đào tạo hay phục vụ cho các đề
án triển khai.
- Chất lượng của các sản phẩm kết quả: đó là các chi tiết kỹ thuật của sản
phẩm khi in ra cả về nội dung và hình thức. Để phục vụ đào tạo thì yêu cầu không
khắt khe nhiều, song để phục vụ yêu cầu của các đối tượng khác thì yêu cầu này
trở nên rất quan trọng.
- Phần mềm hoạt động với các loại thiết bị của HTTĐL: khả năng nhập dữ
liệu bằng bàn số hay nhập từ màn hình, máy quét, …… yêu cầu về máy tính, màn
hình, máy in, … khả năng nối mạng, chế độ bản quyền của phần mềm.
- Giá cả của phần mềm: hiện nay có rất nhiều phần mềm với nhiều giá khác
nhau, vì vậy phải lựa chọn phần mềm có giá thích hợp với nguồn kinh phí được
đầu tư và dự kiến khả năng hoàn vốn.
Có thể tham khảo số liệu thống kê của Mỹ (tính đến năm 1993) về việc sử
dụng các phần mềm ở các cơ quan hành chính theo bảng theo Lynal Wiggins:
Bảng 3. Bảng thống kê sử dụng phần mềm ở Mỹ
Phần mềm Các cơ sở Tổ chức Từng Từng Hành chính Tổng
liên quốc thuộc quốc khu vực bang liên bang
gia gia
ARC/INFO 95 90 36 65 28 314
INTERGRA 45 11 3 11 5 75
PH
GEO/SQL 13 1 8 7 29
MAPINFO 10 4 11 2 2 29
ATLAS GIS 9 6 7 3 25
GDS 7 9 3 1 20
ERDAS 1 4 7 6 18
SPANS 1 3 3 2 9 18
TRANS 7 2 4 13
CAD
AUTOCAD 4 1 3 1 2 11
GEOVISION 3 3 2 1 1 10
• Xây dựng lực lượng cán bộ chuyên môn để vận hành HTTĐL: Cùng với
việc xây dựng cơ sở vật chất về phần cứng và phần mềm, phải có lực lượng cán bộ
chuyên môn đủ trình độ để vận hành một cách có hiệu quả hệ thống. Những yêu
cầu về trình độ chuyên môn cụ thể như sau:
- Thu thập, tổng hợp và mã hoá các dạng tài liệu để lưu trữ.
- Vận hành thiết bị phần cứng và phần mềm để lưu trữ dữ liệu, chỉnh lý để
hoàn thiện dữ liệu dạng số.
- Có trình độ hiểu biết về chuyên môn để phân tích xử lý hệ thống, tách
chiết được các thông tin cần thiết phục vụ cho các mục tiêu đặt ra.
- Thiết kế và trình bày thông tin kết quả theo các tiêu chuẩn quy định cho
các chuyên môn.
- Vận hành thiết bị để in ấn và lưu giữ kết quả.
- Muốn đảm bảo được các yêu cầu trên, nhân viên của HTTĐL phải được
đào tạo một cách hệ thống và kỹ lưỡng cả về lý thuyết và thao tác thực hiện.
• Quản lý hệ thống
Để HTTĐL có thể hoạt động hiệu quả, một nhân tố quan trọng là hệ thống
quản lý, trong đó vai trò của người tổ chức là có vị trí hàng đầu. Một số yêu cầu về
một người quản lý hệ thống là:
- Có hiểu biết tổng hợp và cơ bản về HTTĐL.
- Có hiểu biết rộng về các lĩnh vực mà HTTĐL sẽ phục vụ, đặc biệt là hiểu
về cơ sở dữ liệu của từng chuyên ngành và những yêu cầu của từng chuyên ngành.
- Có kế hoạch hợp lý khi triển khai các đề án.
- Có khả năng đưa ra các mô hình xử lý và đánh giá được chất lượng của
kết quả.
- Có sự đầu tư hợp lý cho từng công đoạn của quá trình xử lý.
• Trang thiết bị (phần cứng)
Để một HTTĐL vận hành có hiệu quả, phải có hệ thống phần cứng
(hardware) hay trang thiết bị phù hợp. Một số căn cứ để lựa chọn sự đầu tư là:
- Mục tiêu hoạt động của hệ thống: để đào tạo hay để giải quyết những
nhiệm vụ chuyên môn theo các đề án. Các kết quả hay các sản phẩm cần đạt được
của hệ thống (xử lý, xuất dữ liệu, lưu dữ liệu).
- Các đối tượng phục vụ của hệ thống: phục vụ cho từng chuyên ngành hay
có thể phục vụ cho nhiều chuyên ngành.
- Nguồn kinh phí đầu tư: Kinh phí có thể được cung cấp từ nhiều nguồn, kể
ca nguồn vốn huy động để có thể hoàn trả từ kết quả hoạt động của hệ thống.
Có rất nhiều hệ thống máy tính và thiết bị ngoại vi song tiêu chuẩn kỹ thuật
được phân thành các nhóm sau:
- Servers: là thiết bị giúp quản lý tài liệu và các thiết bị theo mạng của các
trạm và các thiết bị đầu cuối (terminal). Có rất nhiều loại Server khác nhau, song
nhìn chung Server là trang bị của mạng lớn.
- Workstation (trạm): có nhiều loại trạm: trạm máy tính cá nhân (như IBM,
UNIX, NT…).
- Thiết bị ngoại vi: bàn số, máy plotter, printer, máy ghi vào phim ảnh, máy
ghi đĩa từ, …
- Thiết bị mạng: Các chi tiết để nối các máy tính hoặc giữa trạm và các
máy tính cá nhân.
• Hệ thông tin địa lý với đa phương tiện (multimedia)
Phương tiện (multimedia) là khái niệm được hình thành trong quá trình phát
triển của các công nghệ tiên tiến, đặc biệt là công nghệ tin học, viễn thông, hình
ảnh và mạng, với mọi quy mô khác nhau. Đa phương tiện là yêu cầu phát triển ở
mức độ cao hơn của hệ thông tin địa lý.
Một số đòi hỏi của HTTĐL trong môi trường đa phương tiện là:
- Nhiều thông tin được trình bày cho cùng một vị trí, cùng một thời điểm.
- Nhiều thong tin của nhiều nơi được trình bày trong cùng một thời gian.
- Thông tin cho cùng một địa điểm nhưng ở nhiều thời gian khác nhau.
- Thông tin cho nhiều nơi với nhiều thời gian khác nhau.
Hiện nay, phương tiện được sử dụng hỗ trợ cho HTTĐL gồm nhiề loại khác
nhau như: hình ảnh, phim video, mạng internet và thư điện tử, điện thoại các loại
… Đặc biệt, vấn đề giao diện thông tin 2 chiều luôn được quan tâm để cho hoạt
động của HTTĐL có thể kịp thời điều chỉnh và nâng cao chất lượng xử lý dữ liệu.
• Tóm lại, thiết kế hệ thống là một vấn đề tổng hợp được đặt ra khi xây
dựng một HTTĐL. Những nội dung cần phải được xem xét, được hệ thống hoá
theo các công đoạn sau:
- Các mục tiêu cần đạt đươc của việc xây dựng HTTĐL.
- Đưa khái niệm hiệu quả vào trong quá trình xây dựng.
- Xác định những đối tượng phục vụ.
- Xác định những dạng tư liệu cần xử lý và tư liệu sản phẩm.
- Xây dựng một kế hoạch chiến thuật có tính chiến lược.
- Lựa chọn các phần cứng và phần mềm thích hợp.
- Lựa chọn đội ngũ nhân viên điều hành.
- Xây dựng phương pháp quản lý hệ thống.
- Vận hành và bảo dưỡng hệ thống.
- Dự báo những biến động về công nghệ để điều chỉnh một cách thích hợp
trang thiết bị phần cứng và phần mềm.
Những vấn đề về hệ thống
1. Đánh giá như thế nào về lợi ích của HTTĐL.
2. Những sự thay đổi nào được coi là một sự phát triển tốt của một
HTTĐL.
3. HTTĐL có giúp ích được nhiều cho việc thực hiện có hiệu quả các
nhiệm vụ đặt ra đối với một cơ quan.
4. HTTĐL liệu có làm giảm được những công việc bàn giấy thuần tuý?
5. HTTĐL có những hạn chế gì?
6. HTTĐL có những lợi ích gì?
7. Tính chất pháp lý của những sản phẩm tạo nên từ HTTĐL.
8. Yếu tố cơ bản nhất xác định giá trị của sản phẩm HTTĐL.
9. Liệu lợi ích của HTTĐL đem lại có vượt quá nguồn kinh phí đầu tư.
10. Để có một HTTĐL cỡ nhỏ và vừa thì đầu tư như thế nào?
11. Làm thế nào để có được sự ủng hộ cho sự phát triển của một
HTTĐL.
12. Nguồn kinh phí tối thiểu cần đầu tư để xây dựng một HTTĐL.
13. Liệu có thể bán những sản phẩm hoặc tư liệu mà do HTTĐL quản
lý?
14. Giá của thông tin trong một HTTĐL.
15. Làm thế nào để có thể phối hợp trong một đề án HTTĐL.
16. Những ai liệu có thể tham gia vào xây dựng một HTTĐL.
17. Những ai sẽ đảm nhiệm vai trò tìm kiếm đề án, chuẩn bị tư liệu vận
hành hệ thống thiết bị.
18. Yếu tố cơ bản nào quyết định đến thời gian thực hiện của một đề án
HTTĐL.
19. Liệu có một sự quản lý riêng về HTTĐL trong quá trình thực hiện đề
án đã ký kết.
20. Đầu tư một hệ thống phần mềm, phần cứng thì sẽ hoạt động được
bao lâu.
21. Liệu có thể nâng cấp đơn giản cho hệ thống thiết bị hay nó sẽ bị
hỏng hẳn và phải trang bị hoàn toàn mới?
22. Liệu có thể cài đặt HTTĐL như một hệ thống chìa khoá trao tay đơn
giản hay phải luôn lệ thuộc vào nơi cung cấp.
Vấn đề đào tạo và huấn luyện
1. Làm thế nào để nhân viên trong cơ quan có thể tiếp thu được kỹ
thuật mới?
2. Có thể khẳng định với nhân viên là HTTĐL sẽ không loại trừ những
công việc hiện tại của họ.
3. Những đào tạo cần thiết cho đội ngũ nhân viên và quản lý.
4. Những mức đào tạo cần thiết cho việc phát triển một HTTĐL.
5. Thời gian cần thiết cho việc đào tạo.
6. Có những yêu cầu nhân viên được đào tạo phải trình bày kết quả?
7. Những yêu cầu về vật chất trợ giúp cho việc đào tạo.
8. Sử dụng những thuật ngữ mới song chưa được nhất quán như thế
nào.
9. Trang thiết bị phần cứng và phần mềm:
10. Làm thế nào để hiểu rõ về một phần mềm và phần cứng mà có ý
định mua.
11. Liệu có thể cài đặt phần mềm và chạy trên hệ thiết bị hiện có
12. Làm thế nào để lắp ráp thiết bị, liệu có thể nâng cấp như một thay
đổi bình thường về kỹ thuật.
13. Liệu có thể sử dụng máy tính cá nhân nhỏ cho một đề án HTTĐL
nhỏ.
14. Các phần mềm mạnh và đắt hiện nay thường được chia làm nhiều
modul, liệu có thể xác định được những modul nào cần thiết nhất cho đề án.
15. Hiện nay giá của phần cứng và phần mềm liên tục giảm, tại sao
không đợi đến năm tới khi giá hạ xuống rồi mới mua.
Thiết kế cơ sở dữ liệu
1. CSDL của HTTĐL bao gồm những gì?
2. Cấu trúc mạng của CSDL như thế nào?
3. Làm thế nào tạo CSDL?
4. Tiêu chuẩn của CSDL là như thế nào?
5. Có những cách nào để tự động hoá tạo bản đồ.
6. Làm thế nào để đánh giá chất lượng của bản đồ cơ sở?
7. HTTĐL có giải quyết được một số việc hiện nay của cơ quan không.
8. Làm thế nào để giải quyết một cách hoàn hảo những sự không thống
nhất về đường ranh giới khi tạo bản đồ tự động?
9. Độ chính xác cần thiết của các bản đồ được lập bằng HTTĐL.
10. Chi phí cho việc lập bản đồ ở các mức độ chính xác khác nhau?
11. Làm thế nào để chuyển các tài liệu hiện có sang dạng số và có
những khó khăn gì?
12. làm thế nào để liên kết những tài liệu hiện có với HTTĐL.
13. Những khó khăn gì sẽ gặp phải khi nối kết các phần mềm hiện có
với HTTĐL.
14. HTTĐL có liên kết gì với hệ thống máy tính hiện có.
15. Liệu 2 hệ thống có phải là quá thừa so với nhu cầu?
16. Liệu có thể giao diện dữ liệu giữa hai hệ thống hay không và thực
hiện như thế nào?
17. Liệu có thể sử dụng HTTĐL để lập bản đồ và xử lý tài liệu tổng
hợp.
Sử dụng và lựa chọn người tư vấn
1. Liệu có cần thiết người tư vấn?
2. Liệu có thể sử dụng chính người tư vấn để lựa chọn và cài đặt
HTTĐL.
3. Những kỹ thuật gì có thể học được ở người tư vấn.
4. Làm thế nào để khẳng định rõ là mình cần tư vấn.
5. Làm thế nào để xác định một tư vấn tốt nhất cho riêng mình.
6. Người hoặc cơ quan tư vấn có đang làm tư vấn cho nhiều nơi một
lúc hay không.
7. Làm thế nào để xác định những người tư vấn là có danh tiếng.
Lựa chọn và giao việc
1. Ai có thể nhập số liệu bản đồ một cách hoàn hảo.
2. Liệu các công việc có thể làm ở phòng hoặc ở bên ngoài?
3. Có ưu điểm và hạn chế gì về việc ký hợp đồng lập bản đò và nhập
số liệu với bên ngoài.
Bảo dưỡng hệ thống
1. Những công việc gì phải làm để bảo dưỡng sau khi đã mua và cài đặt
HTTĐL.
2. Ai sẽ trợ giúp cho các công nghệ về xử lý HTTĐL, liệu do chính các
nhân viên sẽ làm hay người bán hệ thống hay các tư vấn?
3. Giá cả của việc bảo hành hệ thống CSDL.
Những nỗ lực cộng tác
1. Liệu giá của HTTĐL có thể bàn để cùng chia sẻ với các cơ quan
khác.
2. Làm thế nào để biết được các cơ quan khác có quan tâm để cùng
tham gia vào HTTĐL mà mình sẽ đầu tư.
3. Những lợi ích của mỗi bên khi cùng đầu tư vào một HTTĐL.
4. Nếu nhiều người cùng làm việc trong HTTĐL thì làm thế nào để
phân chia việc lưu giữ tư liệu trong hệ thống.
5. Liệu có thể nhân lượng tài liệu để lưu giữ và cho nhiều người sử
dụng.
6. Khi nhiều người sử dụng thì làm thế nào phát hiện được những bộ
phận bị hỏng cần sửa chữa, bảo dưỡng.
7. Những dạng dữ liệu nào có ở các cơ quan khác.
8. Liệu có thể sử dụng các tư liệu số có ở các cơ quan khác.
9. Sẽ là thực tế khi thấy rằng không thể sử dụng mãi những tư liệu của
các cơ quan khác vì nhiều lý do, trong đó phải kể đến lý do chuyển đổi khuôn
dạng dữ liệu và sự tương thích về mức độ chính xác.
Các thông tin dạng bản đồ chuyên đề và ảnh
1. Các bản đồ tài nguyên rừng.
2. Các bản đồ về phòng cháy rừng.
3. Các bản đồ về tai biến tự nhiên (gió, khô hạn, ngập lụt)
4. Bản đồ bệnh tật của rừng và phân bố các loại côn trùng có hại.
5. Bản đồ quản lý rừng nói chung.
6. Bản đồ quản lý khai thác gỗ.
7. Bản đồ đất.
8. Các bản đồ sử dụng đất và tài nguyên.
9. Các bản đồ quy hoạch rừng.
10. Bản đồ tiềm năng rừng.
11. ảnh máy bay và ảnh vệ tinh của rừng.
Các tài liệu cơ bản
1. Các bản đồ và file dữ liệu bản đồ số
- Mô tả các vị trí
- Toạ độ trong bản đồ UTM (hoặc Gauss)
- Toàn bộ các thông số của bản đồ: độ cao, đường đồng mức.
- Toàn bộ các thuộc tính cần thiết trong file vector.
- Các trọng tâm điểm của ảnh vệ tinh, ảnh máy bay.
- Hệ thống đường, sông suối, …
- Các dữ liệu về polygon, đường và điểm của bản đồ chuyên đề.
- Ghép nối tất cả các ranh giới.
2. Các số liệu tính toán cho bản đồ chuyên đề: diện tích, độ dài, thuộc
tính.
3. Các sản phẩm bản đồ cung cấp từ hệ thống
- các bản đồ in dạng plotter trên phim, trên giấy.
- Toàn bộ các ranh giới cần nghiên cứu.
- Toàn bộ tên và thuộc tính các loại thông tin.
- Toàn bộ các vị trí được xác định.
4. Xử lý tổng hợp
- Xử lý cho những ý định quy hoạch.
- Các phương án dự kiến.
- Các phân tích về diện tích.
- Các phân tích về vùng đệm (phòng chống cháy, bảo vệ rừng).
- Phân tích tác hại của cháy rừng so với rừng còn nguyên vẹn
- Phân tích chồng xếp thông tin của hàng nghìn contour một lúc.
4. Cập nhật thông tin:
- Hiển thị các loại bản đồ và các thuộc tính.
- Bổ sung bằng các thông tin từ ảnh vệ tinh số.
- Hiển thị linh hoạt các ranh giới cần quan tâm.
- Bổ sung các tính chất mới cho từng contour.
- Tính toán định lượng các vùng bị cháy.
6. Lập các bản đồ chuyên đề
- Tạo code màu và mức độ màu cho từng contour rừng và nhiều cây khác
nhau.
- Xác định các code mới cho các vùng tạo nên do chồng xếp thông tin.
7. Những thông tin về vị trí
Xác định các vùng dân cư, đô thị có liên quan tới khu vực nghien cứu với sự
thể hiện ở tỷ lệ lớn.
8. Những thiết bị nhập số liệu:
- Nhập từ trạm và các thiết bị ngoại vi.
- Nhập từ băng từ.
9. các chức năng của hệ thống GIS:
- Số hoá đường, điểm.
- Tạo lập được các polygon với các code riêng. Có thể bổ sung, chỉnh sửa các
polygon.
- Nhập được các số liệu bằng số và bằng chữ từ bàn phím.
- Chỉnh sửa được các đường vector.
- Tạo mầu cho các polygon.
- Nối hoặc cắt các đường vector.
- Làm sạch các đường trong vector.
- Chia nhỏ polygon hoặc nhập các polygon.
- Kiểm tra các điểm và đường.
- Nhập các thuộc tính hình học
- Tạo lưới hoặc nội suy từ đường, điểm.
- Tạo các vùng đệm cho điểm, đường, vùng.
- Vẽ các vòng tròn tự độn từ các điểm.
- Tìm kiếm các thuộc tính.
- Xác định được các trọng tâm của mạng lưới.
- Tạo được các cửa sổ.
- Thay đổi tỷ lệ bản đồ.
- Thay đổi được lưới chiếu.
- Đo đạc các thông số cần thiết: độ dài, chu vi, diện tích.
- Tính các trị số thống kê.
- Xử lý chồng xếp polygon.
- Phân tích lưới ô vuông, nội suy.
- Nối các điểm biên.
- Tạo lập mô hình 3 chiều.
- Lập mô hình và tính các thông số hình học: độ dốc, hướng dốc.
10. Lập báo cáo
- Thống kê diện tích bằng các con số tiêu chuẩn.
- Các số liệu tổng hợp (min, max, medium).
- Tính toán khối lượng hiện tại.
- Tính toán dự báo.
11. Các thiết bị cần có
- Bàn số.
- Trạm nhỏ.
- Nhập dữ liệu bằng trạm
- Khả năng lưu số liệu vào đĩa.
- ổ băng, ổ đĩa.
- Màn hình điều khiển.
- Màn hình hiển thị phân giải cao.
- Máy in laze màu.
- Máy plotter màu.
12. Phần mềm
- Phần mềm hệ thống với đầy đủ các chức năng chính kể trên.
- Phần mềm phụ để thực hiện những công việc trợ giúp.
- Các phần mềm phổ thông khác.
Lựa chọn một phần mềm HTTĐL
Quả thực là khó khăn để lựa chọn được chính xác một phần mềm cho một tổ
chức. Trong rất nhiều trường hợp, quyết định lại dựa vào hệ thống maketing của
nơi bán mà không do sự lựa chọn của người mua. Vì vậy, phải có những tiếp cận
hệ thống trước khi quyết định mua và trang bị một phần mềm.
Nhiều phần mềm khi đã mua rừngồi thì trở nên không thích hợp với những
tiến bộ của công nghệ, đặc biệt là với phần cứng và phần mềm (khi so sánh với các
phần mềm khác). Một số phần mềm lại không thích hợp với loại tư liệu cần nguồn
kinh phí có thể đầu tư tiếp theo về phần cứng và thiết bị ngoại vi. Một số phần
mềm khi trang bị rồi thì không có người sử dụng hoặc sản phẩm làm ra không phù
hợp với yêu cầu.
Vì thế, trước khi quyết định mua, cần yêu cầu người bán cung cấp đầy đủ các
thông tin chi tiét về tính năng kỹ thuật, về số lượng khách hàng đang sử dụng.
Nếu có thể được thì có thể tham khảo thông tin của những người đang sử
dụng phần mềm đó. Những căn cứ chính để xem xét khi mua một phần mềm có
thể được liệt kê như sau:
- Phần mềm có giải quyết được nhiệm vụ đặt ra của cơ sở một cách đồng
thời và chính xác.
- Những sản phẩm cụ thể của hệ thống được thực hiện bởi các khách hàng
đã mua như thế nào.
- Những yêu cầu cụ thể về kỹ thuật của công việc có được khẳng định bởi
người bán.
- Giá cả có phù hợp với nguồn kinh phí được đầu tư.
Kết luận
Những vấn đề trên đây đưa ra nhằm khẳng định rằng trước khi xây dựng một
HTTĐL phải cân nhắc và chuẩn bị thật đầy đủ kế hoạch và phương án vận hành.
Có như vậy việc đầu tư mới trở nên có hiệu quả trong việc triển khai các công việc
tại mỗi một địa chỉ sử dụng HTTĐL. Các phần đó đã đề cập đến những vấn đề cơ
bản nhất của HTTĐL, những khái niệm đó được liệt kê trong những vấn đề sau:
1. Cơ sở dữ liệu.
2. Quản lý cơ sở dữ liệu.
3. Các chức năng và các chương trình ứng dụng.
4. Can thiệp của người sử dụng.
HTTĐL là một hệ thống công cụ (tool) ứng dụng cho nhiều ngành, nhiều
lĩnh vực phần cứng, phần mềm và 4 thành phần cơ bản ở trên. Mỗi một thành phần
đều có vai trò quan trọng quyết định đến sự hoạt động của một HTTĐL. Có rất
nhiều dạng cơ sở dữ liệu, song có thể xếp vào 2 dạng chính: vector và raster.
Viễn thám là một lĩnh vực công nghệ có sự tồn tại và phát triển độc lập cùng
với các lĩnh vực công nghệ khác. Tuy nhiên, trong HTTĐL, viễn thám có thể được
xem như một công nghệ phối thuộc để cung cấp các nguồn tư liệu dạng rừng raster
và vector một cách phong phú, đa dạng, có tính khách quan, cập nhật và độ chính
xác cao. Viễn thám với một số kỹ thuật xử lý chuyên đề đã tách chiết được nhiều
thông tin mới từ tài liệu ban đầu, góp phần bổ sung cho CSDL của HTTĐL thêm
phong phú.
Các nhiệm vụ cần giải quyết – các phép xử lý tư liệu:
1. Tra cứu: Xác định vị trí và thuộc tính dữ liệu
2. Cung cấp tư liệu: Xuất dữ liệu theo yêu cầu.
3. Nhập dự liệu: Nhập và đăng ký các thuộc tính bằng các phương
pháp: số hoá, bàn phím, chuyển khuôn dạng.
4. Hiển thị: nghiên cứu và khai thác các tài liệu nhập vào.
5. Lựa chọn: Chọn tư liệu cần thiết và các thuộc tính kèm theo
6. Hiệu chỉnh: Sửa lỗi và bổ sung thuộc tính cho dữ liệu
7. Tổng hợp: Tổng hợp các tư liệu vào một mô hình hoặc hình ảnh của
thế giới thực (có toạ độ, thuộc tính)
8. Điều khiển: Sử dụng các mô hình để điều khiển tư liệu
9. Định vị: Bổ sung các thông tin định vị GPS
10. Phân tích: Khai thác, xử lý các thông tin 1 lớp, nhiều lớp, thông tin
biểu bảng, chồng xếp thông tin theo mô hình.
11. Đưa ra quyết định: áp dụng các mô hình xử lý nhiều lớp, các bài
toán đánh giá, quy hoạch, đưa ra các lớp thông tin tổng hợp.
12. Trình bày: Trình bày các kết quả ở dạng bản đồ, đồ thị, thống kê,
báo cáo với chất lượng cao.
Trong quá trình vận hành HTTĐL, một khâu rất quan trọng có vai trò quyết
định là sự điều hành của người sử dụng. Vì vậy, muốn HTTĐL hoạt động có hiệu
quả phải có trình độ hiểu biết và khả năng thành thạo trong vận hành hệ thống.
Ngoài những kiến thức về phần cứng, phần mềm, người sử dụng phải có kiến thức
về các chuyên ngành có liên quan đến đề án đang triển khai. Bên cạnh đội ngũ
người vận hành, phải có sự điều hành chung theo những quy trình hệ thống của
người tổ chức. Vì vậy, vai trò con người ở trong HTTĐL là khác nhau ở từng
khâu, từng mức độ song tất cả phải là một sự thống nhất, trong đó có cả vai trò của
các tư vấn và sự cộng tác rừngộng liên ngành.
Cùng với sự phát triển của viễn thám, HTTĐL và công nghệ đa phương tiện,
khả năng cung cấp tư liệu và trao đổi tư liệu làm cho CSDL cơ bbản ngày càng
phong phú và hoàn thiện, nó là tiền đề cho việc phát triển ứng dụng HTTĐL trong
nhiều lĩnh vực cả tự nhiên và xã hội, cả việc quản lý, theo dõi và dự báo.
Việc xây dựng các HTTĐL là cần thiết cho nhiều cơ quan, nhiều ngành,
nhiều cấp khác nhau. Tuy nhiên, để thực hiện việc đầu tư và xây dựng HTTĐL cần
phải có sự phân tích kỹ lưỡng trước khi đi đến quyết định. Có như vậy thì HTTĐL
mới trở thành một công cụ đắc lực cho nhiều lĩnh vực quản lý, nghiên cứu và triển
khai.

Giao Trinh GIS

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Giao Trinh GIS

Uploaded by

Copyright:

Available Formats

HỆ THỐNG THÔNG TIN ĐỊA LÝ

GEOGRAPHICAL INFORMATION SYSTEM

I.CÁC KHÁI NIỆM CƠ BẢN VỀ HTTĐL

Hình 1. Mô tả một số khái niệm vector nguồn

Hình 2. Mô hình tổ chức của HTTĐL

II.CÁC CHỨC NĂNG CỦA PHẦN MỀM HTTĐL

II.5.CÁC MÔ HÌNH CẤU TRÚC CƠ SỞ DỮ LIỆU

Hiình 5. cấu trúc dữ liệu vecter

Hình 6. So sánh giữa cấu trúc Raster và Vector

II.7.Chuyển đổi khuôn dạng dữ liệu

Hình 8. chuyển đổi Raster và véctơ

III.TÍNH CHẤT ĐỊNH LƯỢNG CỦA PHÂN TÍCH KHÔNG GIAN

Hình 9. các đường kinh tuyến, vĩ tuyến trong hệ toạ độ lưới

Hình 10. Các yếu tố chính của trái đất

Hình 13. Triển khai của lưới chiếu hình trụ

180W 174W 168W 162W 156W

Hình 14. Hệ toạ độ UTM

Ở đây: σ là phương sai

IV.ĐIỀU KHIỂN CÁC LỚP THÔNG TIN

xo¸ kÕt qu¶

Bản đồ ban đầu Bản đồ sau khi loại bỏ

Figure 27. Kết quả phân tích sự gần gũi

Hình 28. Kết quả phân tích sự gần gũ Thiessen i

owner join Doe

H×nh Cho 1 vÝ dô vÒ qu¶n lý ®Êt

®iÓm ®−îc lùa chän

Khu vùc chung

k hu vùc ®−îc chän

H×nh : lùa chän theo vïng

Hình 30. Sự lựa chọn đối tượng theo vùng

Khu bu«n b¸n kh«ng bj ngËp

Khu bu«n b¸n bj ngËp

Khu d©n c− kh«ng bj ngËp

®ång nhÊt b×nh th−êng hai cùc trÞ

xiªn (to¸n häc) xiªn cong (h×nh häc) nhãm

Hình 32. 6 mẫu phân bố tần số thông dụng

B¶n ®å ®−êng giao th«ng B¶n ®å ph©n vïng

IV.2.Điều khiển thông tin nhiều lớp (multilayer operation)

B (3 polygon) C (14 polygon)

Hình 36. phép giao cắt trong thuật toán logic

input identity kÕt qu¶

Hình 39. Tính khoảng cách điểm

2. Số hoá bản đồ sử dụng đất và bản đồ ngập lụt

3. Áp dụng chức năng NEAR để tạo các Buffer đường, điểm.

Hình 41. Mô tả cho các dạng phân bố điểm khác nhau

ph©n b è ®Òu, tËp trung ph©n bè ph ©n t¸n p h©n bè ngÉu nhiªn

Hình 42. Độ phân tán của các điểm

ph©n bè ph©n t ¸n ph©n bè ngÉu nhiªn ph©n bè nhãm

Hình 43. Sự phân bố ngẫu nhiêncua các điểm

VI.PHÂN TÍCH ĐƯỜNG

VII.CÁC BỀ MẶT THỐNG KÊ

1.1. CÁC PHÉP PHÂN TÍCH KHÔNG GIAN CƠ BẢN TRONG

1.2. GIỚI THIỆU VỀ CÁC THIẾT BỊ XUÂT NHẬP DỮ LIỆU

1.3. THIẾT KẾ VÀ TRIỂN KHAI HỆ THÔNG TIN ĐỊA LÝ

You might also like