Professional Documents
Culture Documents
6 6
5 5
4 4
3 3
2 2
1 1
0 0 1 2 3 4 5 6
1 2 3 4 5 6
Hình 3. Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B)
Một đường trong cấu trúc Raster là một loạt cácpixel nối với nhau và một
polygon là một đám (cluster) của các pixel có cùng một giá trị.
Sau đây là những ưu điểm cơ bản của cấu trúc Raster:
• Đơn giản và dễ tham khảo
• Việc chồng xếp các lớp bản đồ được thực hiện một cách thuận tiện đưa
đến kết quả.
• Đối với mô hình không gian, các đơn vị địa lý được xác định trong cấu
trúc Raster, bao gồm hình dạng và kích thước. Như vậy trong kết quả mối quan hệ
giữa các pixel là ổn định và dễ dàng vẽ ra được.
• Dễ thiết lập một bề mặt liên tục bằng phương pháp nội suy.
• Đa số các tư liệu không gian thường được ghi ở dạng Raster như ảnh vệ
tinh, ảnh máy bay chụp quét. Thông thường các tư liệu Raster đó dẽ dàng nhập
trực tiếp mà không cần một sự thay đổi nào.
Những nhược điểm của cấu trúc dữ liệu Raster:
• Tài liệu thường bị tình trạng quá tải, làm tốn nhiều phần của bộ nhớ trong
máy tính. Trong rất nhiều trường hợp, các yếu tố bản đồ không nhất thiết phải
được gắn thuộc tính (code hoá) thành các ô lưới đặc trưng. Trong cấu trúc dữ liệu
Raster, những vùng rất rộng lớn có đặc điểm giống nhau được tồn tại một cách
ngẫu nhiên với một giá trị nào đó và là tập hợp của rất nhiều ô lưới. Trong khi đó
khi thể hiện về độ dốc thì ở vùng có độ dốc tương đối giống nhau, cấu trúc raster
vẫn thể hiện sự khác nhau do kích thước của các pixel tạo nên đường gồ ghề.
• Mối quan hệ về hình học giữa các yếu tố không gian thì khó vẽvà khó
thiết lập được, ví dụ với hai bản đồ được xác định bằng hàng, cột thì mối liên hệ
hình học giữa các đặc điểm của hai bản đồ đó là rất khó xác định.
• Các bản đồ Raster thường thô và kém vẻ đẹp hơn so với bản đồ vẽ bằng
đường nét thanh của cấu trúc Vector. Trong bản đồ Raster, các yếu tố đường,
sông, … ranh giới thường được biểu hiện bằng các pixel nên có dạng răng cưa.
• Việc chuyển đổi các thuộc tính không gian của cấu trúc Raster thì dễ bị
nhiễu. Ví dụ một con đường khi quay đi một góc nào đó rồi quay lại đúng góc đó
nhưng nó có thể bị biến đổi so với hình dạng ban đầu.
• Đối với phân tích không gian, hạn chế nhất của cấu trúc Raster là độ
chính xác thường thấp so với mong muốn (ví dụ khi tính độ day của một đoạn
thẳng sai số thường lớn hơn so với đo trực tiếp). Đây là điều khó tránh khỏi vì kích
thước tính được liên quan đến kích thước của các pixel và vị trí của một đoạn
thẳng hay của một điểm cũng được xác định tuỳ thuộc kích thước của pixel.Đây
cũng là một điểm cần lưu ý trong khi thể hiện bản đồ dạng Raster ( hình 4 )
Hình 4. Mô phỏng cách thể hiện các khoanh vi theo cấu trúc Raster
II.5.3.Cấu trúc dữ liệu dạng Vector
Như phàn trên đã giới thiệu,trong cấu trúc dữ liệu dạng Vector, các đối tượng
không gianđược trình bày bằng một loạt các Vector. Trong khái niệm toán học,
một Vector được thể hiện bằng một điểm xuất phát (starting point) với toạ độ X và
Y đã cho, một hướng (direction) nghĩa là có một góc nào đó theo hướng đông, tây,
nam, bắc và một độ dài (length). Một điểm được thể hiện bởi một Vector bị thoái
hoá (degenerate) với cả hướng và độ dài của nó đều bằng 0. Trong trường hợp này
điểm cũng không có cả diện tích.
Một đường được thể hiện bởi sự lặp lại của các Vector, mà các Vector này là
các đoạn thẳng vì chiều rộng của các Vector cũng không được xác định nên về ý
nghĩa không gian, đường chỉ có một kích thước, đó là độ dài.
Một polygon được thể hiện bở một loạt các Vector tạo nên một vùng khép
kín và diện tích của vùng đó có thể đo được.
39
103
34
Hình 7. Cấu trúc một polygon đơn giản trong mô hình cung và điểm nối
Trên hình 3 có 4 polygon 101, 102, 103 và 104, các polygon được xác định
bởi 7 cung (are) từ 33-39. Mỗi cung có một điểm nối là điểm đầu và điểm cuối.
Những cung thẳng là không có giao điểm còn những cung gấp khúc là có một
hoặc nhiều giao điểm (vertex). Một điểm quan trọng cần lưu ý về mô hình cung -
điểm nối là một cung luôn được xác định bởi một điểm nối.
Hướng của một cung được hiểu một cách đặc biệt trong thứ tự của các điểm
nối, đó là điểm đầu và điểm cuối. Với một hướngđã biết thì hai phía (phải và trái)
của cung cũng được xác định. Những thông tin về một cung bao gồm:
Thuộc tính (ID) của cung
Thuộc tính (ID) của điểm nối đầu
Thuộc tính (ID) của điểm nối cuối
Thuộc tính (ID) của polygon bên trái của cung
Toạ độ x, y của điểm nối đầu
Toạ độ x, y của điểm nối cuối
Toạ độ của tất cả giao điểm
Ngoài ra trường (field) bao gồm độ dài của một cung cũng được xác định.
Điểm nối có ý nghĩa về mặt hình học là nó thể hiện sự tiếp nối giữa hai yếu
tố mô hình cung - điểm nối (area-node), một điểm được thể hiện bằng một yếu tố
đường bị thiếu hụt (degenerate) với điểm nối đầu trùng lên điểm nối cuối và không
có điểm giao cắt ở giữa.
Như vậy, một điểm được thể hiện bằng một điểm nối (node) vì điểm nối đầu
và điểm nối cuối là giống nhau. Đối với polygon như đã nêu ở trên thì mỗi
polygon là bao gồm tập hợp các cung và điểm nối. Để xác định mối quan hệ
không gian của polygon thì mọi điểm giao cắt phải được xácđịnh bằng một điểm
nối.
Ưu thế cơ bản của mô hình cung cầu - điểm nối là luôn có thuộc tính không
gian và như vậy mức độ chính xác sẽ rất cao, đồng thời dễ xác định được mối
quan hệ không gian của các yếu tố. Ví dụ sự tiếp giáp của hai polygon hay
pplygon này nằm trong polygon kia và cách đơn giản là xem ở bảng thống kê các
cung mà chúng ta tạo nên 2 polygon đó. Trong bảng thống kê nếu có một cung nào
đó là một phần của cả hai polygon thì 2 polygon đó là nằm liền kề nhau.
Phần mềm ERIS ARC/INFO là phần mềm điển hình có tổ chức vector theo
mô hình cung- điểm nối và nó tự động tính và thống kê các thuộc tính của cung,
điểm nối, từ đó dễ dàng cho việc tính toán và xử lý các mô hình không gian.
Trong ARC/INFO, có hai dạng bảng thống kêlà bảng thống kê thuộc tính của
các polygon (polygon attribute table - PAT) và bảng thống kê thuộc tính của các
cung are attribute table – AAT.
Bảng 1. bảng thuộc tính của polygon PAT
# - ID N0 Poly – ID Thuộc Perimeter Area
Thuộc tính tính polygon Chu vi Diện tích
1 0 8418 4,506
2 104 8596 2,078
3 102 4296 1,144
4 101 2233 0,301
5 103 4325 0,983
Bảng 2. Bảng thống kê thuộc tính của cung AAT
# - ID Area- ID F-node T- node I- Poly. P P-Poly. P Length
Thứ tự Thuộc điểm điểm bên trái bên phải độ dài
tính cung đầu cuối
1 38 3 1 2 1,1 51
2 33 4 3 5 1,0 40
3 35 4 1 3 2,1 50
4 37 2 2 4 2,2 33
5 36 1 5 2 4,1 20
6 39 5 3 2 1,0 93
7 34 4 5 1 2,1 93
Trên bảng PAT, mọi tính chất chi tiết của polygon đều được tính và thống
kê, các chi tiết đó gọi là coverage.
Polygon thứ nhất (#-ID: 1)được gọi là polygone tổng hợp (universe
polygone), nó thể hiện một vùng tổng hợp tất cả các polygon có bên trong và có
diện tích được quy định là âm và có giá ttrị tuyệt đối bằng tổng diện tích của các
polygon bên trong. Các polygon tiếp theo được gắn các thuộc tính và các giá trị:
chu vi, diện tích mà được tính tự động khi các tính chất chi tiết được thiết lập.
Bảng AAT mỗi cung được xác định bởi cả số thứ tự và thuộc tính của cung,
thuộc tính của điểm đầu, điểm cuối và thuộc tính của các polygone ở bên phải, bên
trái của cung. Và các polygon này cũng chính là các polygone ở trong bảng PAT.
Ví dụ: polygone số 3 trong bảng AAT có số thứ tự là 3 và thuộc tính là 102 t0
bảng PAT.
Cả 3 yếu tố quan trọng của vector về tính chất hình học (topology) là tính
chất nối tiếp (adracency), tính chất chứa đựng (containment) và tính chất nối
(conectivity) là những yếu tố rất quan trọng và là vấn đề cốt lõi của mô hình cung
- điểm nối (are - node). Các yếu tố này sẽ giúp người phân tích xác định rõ được
tính chất của các yếu tố trong bản đồ.
Ví dụ: để xác định hai polygon có tiếp giáp nhau hay không, người phân tích
chỉ cần xem các cung xác định nên hai polygon đó, nếu có một cung nào cùng tính
chất thì nó chính là vị trí tiếp giáp của hai polygon. Trong bảng TAB, hai polygon
có số 102 và 103 được tiếp giáp nhau bởi cung số 33 trong bảng AAT.
Để xác định tính chất chứa đựng, cách xác định cũng như vậy. Muốn xác
định polygon A được chứa bởi polygon B hay không thì trước hết phải xác định
các cung tạo nên polygon A và thuộc tính của cả hai bên các cung, nếu như xác
định thấy A luôn ở mọi phía của cung thì A nhất thiết phải được chứa trong B. Ví
dụ cung số 37 trong hình 3 xác định nên polygon số 101, một phía của cung luôn
là polygon số 104 thì nhất thiết polygon số 101 phải được chứa trong polygon số
104. Trong trường hợp một polygon lớn chứa nhiều polygon nhỏ bên trong cũng
xác định một cách tương tự.
Tính chất tiếp nối của một cung được xác định từ thuộc tính của điểm đầu (F)
và điểm cuối (T) trong bảng AAT. Hai cung được xem là nối trực tiếp một khi có
chung điểm nối. Ví dụ trong bảng, cung 33, 38 và 39 là có chung một điểm nối số
3.F. Trong khi đó cung số 37 là không được nối với một điểm nào cả vì nó chỉ có
một điểm nối riêng của nó (số 2) tạo nên polygon thứ 4 có thuộc tính là 101.
Ví dụ trên là ví dụ cho một sự ưu điểm của mô hình cung - điểm nối, nó xác
định mối liên hệ hình học của các yếu tố và điều rất quan trọng trong xử lý không
gian. Mặt khác, vị trí (toạ độ x, y) của mỗi một điểm nối, điểm giao cắt cũng được
xác định. các thuộc tính đó cũng được thống kê rõ ràng trong bảng PAT và AAT
giúp cho người phân tích dễ dàng xử lý các thông tin. Trong thực tế, các tư liệu
không gian là rất phức tạp, mô hình are-node là công cụ hữu hiệu cho việc xử lý.
Hiện nay các phần mềm ERSI-ARC/INF và INTERGRAPH được xây dựng theo
mô hình này, Trong khi đó, phần mềm MAP/ INFO không được xây dựng theo mô
hình cung-điểm nên giao diện giữa chúng không tương thích.
Tóm lại: nội dung phần này nhằm giới thiệu tập trung vào tư liệu không gian,
đó là cơ sở cho việc xử lý HTTĐL. Công việc thống kê thuần tuý thì không cần
phải có các dữ liệu không gian, sự phân tích không gian thì lại rất cấn các thông số
đó, đặc biệt là các thông số về địa lý và bản đồ.
Các đối tượng không gian có thể được trình bày dưới các dạng khac nhau là
đường, điểm và polygon. Các yếu tố cơ bản của chúng cần được xác định đó là vị
trí, thuộc tính và tính chất hình học.
Việc tổ chức các yếu tố này ở hai dạng cấu trúc Raster và polygon là khác
nhau. Nhìn chung vị trí và thuộc tính thì được tổ chức tương đối giống nhau
trongcả hai dạng cấu trúc dữ liệu, song tính chất không gian thì hết sức khác nhau.
Trong xử lý không gian, các thông tin quan trọng nhất về hình học và tính
chất tiếp giáp, chứa đựng và nối tiếp, cấu trúc Raster có hạn chế cơ bản là không
thể hiện được mối quan hệ không gian. Thay vào đó, cấu trúc Vector và đặc biệt là
cấu trúc cung- điểm nối có ưu điểm là cung cấp đầy đủ các thông tin thuộc tính
của điểm, đường và vùng nên nó giúp cho việc xử lý không gian được rõ ràng và
hiệu quả.
II.5.Mô hình mạng (network model)
Trong mô hình mạng , các cung trở thành mạng được thể hiện trong mạng
giao thông (đường sắt, đường bộ, đường không), mạng lưới điện , mạng thông tin
, mạng ống gas, ống nước. Các điểm nối trở thành các điểm nối, điểm dừng hoặc
điểm giữa của mạng giống như hệ thống chạc 3 hoặc hệ thống van một cổng dẫn.
Các điểm đó là nơi để dừng hoặc tiêp nhận các đối tượng hoặc đưa ra các đối
tượng cần lưu thông , tương tự các điểm dừng xe, bến đổ, nơi chuyển tải.. Trung
tâm của mạng là nơi chuyển tải nguồn cung cấp hoặc là nơi có những hoạt động có
tính chất cung ứng cho mạng như: siêu thị, bệnh viện, sân bay, trường học… ở qui
mô lớn hơn trung tâm có thể là cả một thành phố cung cấp , chuyển tải cho cả một
vùng rộng lớn. Như vậy điểm liên hệ trong mạng là những đầu mối và các đường
dẫn và mối liên hệ đó có hướng nhất định theo các điểm quay - đổi chiều. Tóm lại
những tính chất như đường nối , điểm nối , các điểm dừng , các trung tâm và các
điểm quay là những thông tin thuộc tính của mô hình mạng cơ sở dữ liệu vector.
Còn một tính chất khác của mạng là sự cản trở (tương tự điện trở của mạch điện).
Sự cản trở bởi khối lượng thông tin được truyền và thời gian truyền tải. Sự cản trở
có liên quan đến nhiều yếu tố của mạng, đồng thời có liên quan đến cả năng lượng
truyền. Trong mạng của HTTDL với dữ liệu vector , những yếu tố quan trọng ảnh
hưởng đến sự liên kết trong mạng đó là yếu tố hình học và sự nối tiép. Ngoài ra
các thuộc tính khác của đối tượng cũng phải được bố trí hợp lý cho từng mạng.
0
180
60 (N)
0
135
0
60
§«ng
0
135
XÝch ®¹o 70
0
70
0
T©y
0 Kinh tuyÕn chÝnh
0
Cùc Nam (S)
Kinh tuyÕn
XÝch ®¹o
VÜ tuyÕn
Cùc Nam
Hình 12.Lưới chiếu hình trụ triển khai thành mặt phẳng với các ô hình chữ nhật
Hệ chiếu hình nón là hệ chiếu che phủ lên hình cầu hoặc cắt qua nó bởi một
hình tháp nón chuyển thành dạng hình nón cụt (hình 13).
Bắc
Xích đạo
80Nam
Nam
P1(1,4)
4
D1,2
3
2 P2(4,2)
X
0 1 2 3 4
Hình 15. Đoạn thẳng segment (D1,2) được xác định bởi hai điểm đầu và cuối
Khoảng cách Ơclit là khoảng cách của một đoạn thẳng nối giữa hai điểm trên
một mặt phẳng. Trong thực tế, việc đo đạc có thể được thực hiện bằng cách khác.
Ví dụ: một phép đo được gọi là đo khoảng cách Manbattan với ý nghĩa như:
"khoảng cách khối phố - city block distance), ở đó áp dụng hệ toạ độ lưới Grid
tương tự như các khối phố. Khi đó khoảng cách Manbattan được tính theo công
thức:
Di,j = (Xi - Xj) - (Yi - Yj)
Diện tích của rất nhiều vùng nhỏ tạo nên một polygon thì có thể được tính
bằng việc lập một đa giác (trapezoid) từ tất cả các đoàn thẳng đó rồi tính tập hợp
cho diện tích của cả polygon.
P2
Y2
P1 P3
Y1
P5
P7
P4
P6
X7 X6 X1 X2 X5 X3 X4
Hình 16. Tính diện tích một polygon theo phương pháp đa giác (trapezoid)
Polygon trên tạo nên từ 7 điểm và 7 đoạn thẳng. Mỗi đoạn thẳng được xác
định bởi hai điểm (điểm nối hoặc điểm giao cắt). Mỗi đoạn thẳng có hai đường
thẳng song song với trục Y để xác định các giá trị X cho từng điểm. Sẽ có các hình
thang (đa giác) được tạo nên bởi các đường thẳng song song đó, đoạn segment và
đoạn hình chiếu của chúng trên trục X, khi đó:
( X i + Yi )( X i − Yi )
Ai , j =
2
Ở đây: Aij: diện tích hình thang
i, j là điểm thứ i và j
Khi áp dụng công thức này và tính cộng dồn chiều kim đồng hồ ta sẽ được
điện tích của polygon (lưu ý khi tính diện tích của các hình thang xác định bởi các
đoạn P7 - P1, P1 - P2, P2 - P3 và P3 - P4 sẽ có giá trị dương và diện tích tạo bởi
các đoạn P4 - P5, P5 - P6, P6 - P7 sẽ có giá trị âm và tổng của tất cả các diện tích
7 hình thang sẽ cho diện tích của polygon G (P1 ... P7).
Tương tự như vậy, nếu ta vẽ tạo thành các tam giác cho toàn bộ các đoạn
segment và đưa về hệ toạ độ ban đầu rồi tính tổng diện tích các tam giác thì kết
quả cũng là diện tích của cả polygon. Hai phương pháp đều có độ chính xác tương
tự như nhau
III.4.2.Đo đạc các tính chất của thuộc tính
Trong cả việc lập bản đồ số và phân tích định hướng của các hiện tượng và
đối tượng không gian thì các đối tượng (hoặc đơn vị địa lý) đều phải được định
lượng hoá và được xử lý theo các giá trị đo đạc. Việc đo các dữ liệu thuộc tính phụ
thuộc vào tính chất mà có thể đánh giá được và khả năng tài liệu cho phép. Việc
đo đạc các tài liệu thuộc tính được chia ra các mức sau: có tồn tại trên danh nghĩa
(niminal), thông thường (ordinal), khoảng cách biệt (interval) và tỉ số (ratio).
Đo đạc các mức độ (levels)
Đo mức độ danh nghĩa (normal): là sự đo đạc về tính chất và chủng loại. Ví
dụ: tên đất nước sinh ra, màu, nơi sinh, địa bàn có quyền bầu cử (ví dụ ở Mỹ).
Tính chất này chỉ mang tính chất đặt tên theo thứ tự mà không có thuộc tính nào
về khoảng cách hay về bản chất. Ví dụ: thứ tự đặt tên theo vần ABC nghĩa là A tốt
hơn B. Cách đặt tên có thể là theo vần hoặc theo thứ tự. Trong trường hợp đặt tên
theo số thứ tự thì giá trị số đó không thể được dùng để tính toán.
Đo mức độ thứ hạng (ordinal): là xác định ý nghĩa trong khái niệm của một
trật tự mà ở đó mỗi một chỉ tiêu có giá trị đồng nhất khi so sánh với các chỉ tiêu
khác. Ví dụ: một người nào đó có thể nằm trong trật tự phân chia về nghề nghiệp
hoặc vị trí xã hội như: công nhân, trí thức, nông dân ... tầng lớp nghèo, trung bình
hay giàu (về mức độ thu nhập). Trong trường hợp đó, tầng lớp trung bình phải ở
thứ hạng cao hơn nghèo và thấp hơn giàu.
Khi áp dụng đo đạc mức độ thứ hạng có thể xác định thuộc tính (code) theo a
b c hoặc theo trật tự số, nhưng mức độ của sự khác biệt giữa các thứ hạng thì
không được làm rõ về định lượng. Vì vậy, trật tự các số hạng không thể dùng để
tính toán về mặt toán học mà chỉ xác định về mối quan hệ. Ví dụ : bảng độ cứng
của các khoáng vật hay cấp bão, cấp động đất là các minh hoạ tương đối rõ của sự
đo đạc và phân chia về số hạng.
Đo khoảng cách biệt (interval)
Việc đo đạc khoảng cách biệt là xác định về trật tự và khoảng cách giữa các
chỉ tiêu, khoảng cách giữa các chỉ tiêu là ổn định và bằng nhau về đơn vị. Ví dụ
điển hình của sự phân chia này là thang nhiệt độ Census (cả nhiệt độ Ken vin).
Trong đó, khoảng khác giữa 50o và 49o là bằng với khoảng khác nhau giữa 49o và
48o. (Tất nhiên 50o thì không có khái niệm là ấm hơn 25o hai lần).
Một tính chất khác nhau trong việc đo khoảng cách biệt là không có giá trị
của điểm khởi đầu. Ví dụ: 0oC là xác định nhiệt độ của điểm đóng băng nhưng
không có nghĩa là ở 0oC là hết nhiệt.
Nói tóm lại, việc đo khoảng cách biệt cho pháp xác định sự khác nhau giữa
các hiện tượng nhưng không có nghĩa về sự khác biệt biên độ (ví dụ, bão cấp 2
không có nghĩa là mạnh hơn gấp 2 lần bão cấp 6 hay kim cứng (độ cứng 10)
không có nghiã là cứng hơn thạch cao (độ cứng 2) là 5 lần.
Đo đạc tỷ số: đo đạc tỉ số thì đầy đủ tính chất của việc đo khoảng cách biệt,
có thêm một thuộc tính là giá trị 0 được xác định bởi đồ thị. Ví dụ, khi đo khoảng
cách tự nhiên, không cách 0 được hiểu là sẽ không có khoảng cách giữa hai đối
tượng. Khoảng cách này được xác định rõ và một điểm giá trị 0 cũng có ý nghĩa tỷ
số đã được tính. Cụ thể hơn về ý nghĩa đó là khi ta nói 10 km có khoảng cách gấp
hai lần 5 km.
Một ví dụ khác là khi tính trọng số cho một đơn vị đo khi trọng số bằng 0
nghĩa là không có trọng số. Nó có ý nghĩa khi nói 10km3 nặng gấp 2 lần 5m 3 .
Trong kinh tế, trọng số thể hiện cho sự thu nhập mặc dù đơn vị tiền tệ tính có thể
khác nhau. Khi đó, định lượng về ý nghĩa hoàn toàn được xác định.
• Đo đạc Sự hướng tâm và sự phân tán (central tendency and disperion):
xác định sự hướng tâm hay phân tán là nội dung quan trọng nhất của xử lý thống
kế các hiện tượng, trong thống kê, sự hướng tâm thể hiện một trường (trend) của
sự phân bố. Trong khi đó, sự phân tán thể hiện độ phân tán so với mức phân bố
(tendency) trung tâm.
Ví dụ khi tính toán tổng thu nhập khi so sánh giữa hai nhóm dân tộc giá trị
trung bình là một giá trị thống kê ở mức hướng tâm giá trị đó có thể được sử dụng
làm chỉ thị cho mức tổng thu nhập, từ đó có thể so sánh thu nhập của hai nhóm với
nhau, khi đó mức độ phân tán cho biết giá trị trung bình.
Với những giá trị khác nhau đo được ở tỷ lệ thông dụng, sự hướng tâm được
xác định bởi giá trị mode, đó là lớp giá trị có tần số phân bố cao nhất. Ví dụ: một
khu vực có 3 dân tộc sinh sống là đân tộc A chiếm 30%, dân tộc chiếm 60% và
dân tộc C chiếm 10%. Trường hợp đó, mode của khu vực là B vì có số dân đông
nhất. Trong trường hợp đó mode thể hiện sự hướng tâm cũng là B nếu như sự
phân bố là ngẫu nhiên, tần số của mode nhóm được xác định là f mode và sự phân
tán ở tỷ lệ đo thông dụng được tính bởi tỷ số khác biệt (variation ration).
V = 1 - (f mode/N)
Ở đây: V là tỷ số khác biệt
N là tổng số phân bố
Giá trị nhỏ hơn của sự phân tán thể hiện cho trường hợp hướng tâm nhiều và
mode là chỉ thị tốt hơn cho trường phân bố. Nếu như một nhóm dân tộc chiếm
nhiều hơn 80% tổng số dân trong vùng thì tỷ số sự khác biệt là 0,2. Nếu dân tộc
chiếm đa số song cũng chỉ đạt 80% tổng số dân thì trường hợp đó tỉ số phân tán là
0,6.
Mức tập trung của việc đo sự khác biệt về thứ hạng được tính bởi giá trị
trung bình, đó là trường hợp có sự tập trung ở giữa (nghĩa là có một số giá trị cao
hơn hoặc thấp hơn giá trị trung bình). Vì sự khác biệt được đo ở tỷ lệ về thứ hạng
nên toàn bộ các trường hợp có thể phân bố dạng phân nhánh, có nhấnh nằm ở thứ
hạng cao hoặc tháp hơn giá trị trung bình. Trường hợp đó giá trị trung bình sẽ rơi
chính xác vào khoảng giữa của tập hợp. Ví dụ nếu có 15 người lớn thược về nhánh
đi xuống ở một tầng lớp trong xã hội thì trường hợp thứ 8 là thuộc về giá trị trung
bình của vùng phân bố này. Khi đó giá trị trung bình cho biết một điều là nếu có
một người thuộc về thứ hạng cao hơn thì có thể vẫn thuộc về thì có thể vẫn thuộc
về tầng lớp đó hoặc cao hơn. Còn những người ở thấp hơn thứ hạng thì vẫn có thể
thuộc về tầng lớp đó hoặc ở thấp hơn.
Sự phân tán của sự khác biệt về thứ hạng được tính theo tỷ lệ thập phân, với
sự khác biệt giá trị giữa định và đáy của phân vị thứ 10. Ví dụ: điều tra sự phân tán
về ưu thế cuộc sống của 50 thành phố, thứ hạng khác biệt xây dựng theo tỉ lệ từ 1 -
10, khi đó 10 sẽ là ưu thế cao nhất. Nếu như có 5 thành phố có ưu thế nhất thì nó
có thể nằm ở thứ hạng là 8 thuộc về phần đỉnh của thứ hạng 1 - 10, còn lại là 45
thành phố sẽ nằm ở phần đáy của thứ hạng và có giá trị là 3, và như vậy sự khác
biệt (phân tán) sẽ là 5 (khác biệt giữa 3 và 5). Ngược lại, việc điều tra cho thấy có
5 thành phố thuộc về thứ hạng 6, còn lại 45 thành phố thuộc thứ hạng 4 thì sự
phân tán chỉ là 2. Nói tóm lại, giá trị thứ hạng của sự khác biệt là thể hiện mức độ
của sự khác biệt và thứ hạng đó được dùng ở tỷ lệ thập phân.
Sự tập trung của cả việc đo về khoảng khác biệt (interval) hay tỉ số (ratio)
đều được tính toán theo giá trị trung bình:
Z=
∑Z i
N
Ở đây: Zi là trường hợp phân bố thứ i trong vùng phân bố.
Σi là tổng các giá trị Z trong vùng phân bố
N tổng các phân bố
Sự phân tán so với giá trị trung bình được tính bằng độ khác biệt hay phương
sai (variance) hay độ lệch tiêu chuẩn (Standard Deviation).
σ2 = ∑ N
(Z −Σ ) i
2
Σ=
∑Z A i
∑A i
Ở đây: Ai là vùng của đơn vị thứ i, và độ lệch điều chỉnh theo vùng được
tính như sau:
σ 2
=
∑ A ( Z − Σ)
i i
2
∑A i
Sự hướng tâm và phân tán là các thông số cơ bản nhất của việc thống kê để
mô tả một sự phân bố cuả bất kỳ một hiện tượng không gian nào. Chúng cũng
được dùng để so sánh các mẫu không gian của sự phân bố các yếu tố khác nhau
với mục đích phân biệt sự khác nhau ảnh hưởng đến mỗi yếu tố. Sự thống kê
mang tính mô tả cũng được sử dụng để phân tích sự thay đổi trong việc phân bố
của một hiện tượng để hiểu tốt hơn và phân tích được rõ ràng những sự sắp xếp
phân bố không gian.
Ví dụ sau thể hiện sự phân bố không gian của 3 loài chim với sự hướng tâm
và phân tán khác nhau. Sự phân bố là ở kích thước giống nhau và hình dạng địa lý
giống nhau. Như vậy, sự phân bố được tổ chức thành ô lưới với kích thước 5 x 5 ô.
Các ô đánh dấu đen là có sự phân bố chim, còn ô trắng là không có. Sự hướng tâm
thể hiện vị trí tập trung trung bình của các loài.
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
A B C
Hình 17. Ví dụ về sự phân bố không gian
Nhóm A xuất hiện tập trung ở góc trên bên trái. Giá trị trung bình tính toán
của toạ độ x và y là (2,2), còn nhóm B và C có giá trị trung bình ở toạ độ là (3,3).
Như vậy nhóm chim A có sự hướng tâm khác với nhóm B và C, còn nhóm B và C
có sự hướng tâm giống nhau. Độ lệch của sự phân bố không gian được tính bằng
độ lệch tiêu chuẩn. Nhóm A và B tuy có sự hướng tâm khác nhau nhưng lại có độ
lệch tiêu chuẩn với toạ độ của x và y là 0.83 và 0.83. Nói cách khác, phương thức
hai nhóm A và B là có sự phân tán quanh giá trị trung bình giống nhau. Còn nhóm
C, mặc dù có cùng giá trị hướng tâm với nhóm B song có sự phân tán rộng hơn, vì
khi tính độ lệch chuẩn của nhóm C với x và y là 1.63 và 1.63. Giá trị đó thể hiện
sự phân tán của nhóm C bằng hai lần của 2 nhóm kia. Nói cách khác, nếu giá trị độ
lệch lớn thì phương thức phân bố là kém tập trung xung quanh trung tâm.
Tóm lại, phần này giải thích và trình bày cách tính định lượng các giá trị về
vị trí và thuộc tính của các đối tượng không gian. Trong thực tế bản đồ là sự thể
hiện 2 chiều và vị trí của bất kỳ một đối tượng nào cũng được xác định bằng cặp
toạ độ x và y. Tuy nhiên việc chuyển vị trí từ hình cầu với 3 kích thước sang mặt
phẳng nằm ngang có 2 kích thước luôn luôn là vấn đề gặp sai số trong việc xử lý
phép chiếu. Các phân tích không gian nhất thiết phải chú ý đến các tính chất của
phương pháp chiếu được sử dụng trong những dữ liệu gốc. Các giá trị toạ độ luôn
khác nhau giữa các hệ thống toạ độ, ở Mỹ và một số nước Tây âu hay sử dụng hệ
lưới chiếu UTM hay Gausse. Một khi hệ toạ độ được chọn chuẩn xác thì mọi phép
tính trong xử lý không gian có thể được áp dụng bằng các phép toán trong các
phần mềm GIS (ví dụ tính độ dài, diện tích polygon).
Để bổ sung cho việc đo đạc tư liệu về vị trí các phân tích không gian yêu cầu
việc xử lý các dữ liệu thứ hạng và dạng tỉ số. Viêc thống kê giá trị hướng tâm và
phân tán phải căn cứ vào tỉ lệ đo đạc hay trả lời với các câu hỏi khác nhau. Giá trị
hướng tâm và phân tán được xử lý bằng mode và tỉ số.
BÀI TẬP
1. Đổi vị trí của một điểm ở vĩ độ 45o Bắc và kinh độ 171o Tây sang hệ
toạ độ UTM với giả thiết Trái đất là hình cầu thực.
2. Mô tả hệ toạ độ UTM cho một điểm góc toạ độ 496 000 m hướng
Đông, 20 000 m hướng Bắc, vùng 5 có sử dụng phốip hợp kinh độ, vĩ độ và
mét.
3. Dùng phương pháp hình thang tính diện tích của Polygon dưới đây
(hoặc vẽ tay).
- Tính toạ độ x, y cho các điểm nối tạo nên Polygon.
- Tính độ dài của mỗi segment và chu vi của Polygon.
Hình 18. Cắt nhỏ bản đồ gốc để tạo nên bản đồ mới với diện tích nhỏ hơn
Sơ đồ sau sẽ minh hoạ rõ hơn: converage ban đầu có 5 vùng. Nếu dùng SLIP
để cắt ở giữa thì sẽ có một bản đồ mới với thuộc tính là một phần của bản đồ cũ
1
1
2 3
2 3
4 5
4 5
A b c
Hình 19. Kết quả của việc cắt để tạo nên một coverage mới
Khi sử dụng thì vòng tròn bên ngoài của b được sử dụng làm ranh giới cắt.
Kết quả là tạo ra bản đồ C với một số thuộc tính của bản đồ A vẫn còn giữa
nguyên song có diện tích được quy định bởi ranh giới cắt. Tóm lại, cắt lại việc
copy một phần của bản đồ gôc để toạ nên một bản đồ mới
• Xoá (ERASE): xoá là quá trình ngược lại với việc cắt. Xoá là công
việc loại bỏ những phần mà công việc trung gian tạo nên (ví dụ việc cắt) là làm
khôi phục lại những phần có thuộc tính của bản đồ gốc ở trong vùng đã được cắt
ra sẽ bị xoá.
1 1
2 3
2 3
4 5 4 5
Hình 20. Ví dụ của việc xoá để tạo nên một coverage mới
Công việc xoá là rất có ích khi mà tính chất các vùng ở ngoài vùng phân tích
cần vẽ lại như cũ hoặc ngược lại cần loại bỏ đi. Việc này cũng hữu ích khi có
nhiều lỗi tập trung ở một vùng nào đó thì có thể xoá chúng đi để rồi chỉnh sửa lại.
Các vùng cần xóa thường có hình dạng đều đặn hoặc không đều tuỳ người đều
hành.
• Cập nhật (update) hay bổ sung: Cập nhật là công việc thay đổi dữ
liệu không gian trong một vùng nào đó của bản đồ với những thộc
tính mới.
thuéc tÝnh vµo cËp nhËt thué c tÝnh kÕt qu¶ thué c tÝnh
A b c
Hình 21. Cập nhật thuộc tính của B cho A để tạo nên một thuộc tính mới
Trong ví dụ ở hình A, hai đường thẳng cắt vuông gọi là không chính xác và
cần phải chỉnh sửa phần ở giữa. Nếu chỉnh toàn bộ A thì khó khăn hơn là chỉnh
một phần ở giữa. Để chỉnh sửa, ta dùng phần thuôc tính bổ sung ở B để sửa, kết
quả là tạo nên phần thuộc tính mới, ở đó có giữa lại một phần thuộc tính cũ của A
và có chỉnh sửa một phần giữa theo B. Vì vậy, tình năng cập nhật có tác dụng rất
hiệu quả khi cần chỉnh sửa từng phần của một cơ sở dữ liệu rộng lớn.
• Gắn/ nối (append mapjoin): Việc gắn và giáp nối bản đồ là công
việc tương tự, thay cho quá tách, chia bản đồ, đây là việc ghép nối các bản đồ
thành một bản đồ lớn. Hai chức năng này hơi khác nhau một chút, tuỳ thuộc vào
việc tổ chức dữ liệu. Sự khác biệt là việc giáp nối thì không tái tạo hay chia cắt
thuộc tính hình học ở phần bản đồ kết quả. Quá trình gắn và giáp nối là ngược với
quá trình chia đã nêu ở trên. Hình dưới đây là minh hoạ của quá trình gắn và giáp
nối bản đồ.
1 2 2 3
2 3
1
4 5 5 6 5
4 6
4 5 5 6
7 8 9
7 8 8 9
Hình 22. 4 Bản đồ được ghép nối bằng chức năng gắn/ nối bản đồ
Trên hình vẽ 17, 4 bản đồ đất nguyên thuỷ có 4 thuộc tính (coverage) riêng.
Khi gắn/ giáp nối, 4 bản đồ tạo thành một bản đồ lớn ở bên phải. Có một chức
năng phụ phải thực hiện sau khi giáp nối là làm sạch, tẩy nước ranh giới không
cần thiết ở bản đồ kết quả. Thông thường ở ARC/INFO, đó là chức năng
dissolving.
• Tẩy sạch (dissolving): chức năng tẩy là loại bỏ các ranh giới không
cần thiết sau khi các bản đồ đã được giáp nội. Ngoài ra, chức năng này còn cho
phép đặt tên lại các điểm nối giữa các đường với các giá trị thuộc tính xác định.
Thông thường, chức năng này kiểm tra tất cả các đoạn thẳng để xác định xem các
đoạn thẳng khi nối với nhau có cùng thuộc tính như yêu cầu hay không. Trong
trường hợp hai polygon giáp nối là có cùng thuộc tính (ID) trong khi ở bản đồ kết
quả có một segment ở giữa thì có thể loại bổ segment đó đi để giáp nối cả hai
polygon đó với nhau.
A
B
A B A
B
C C
B
B
A
Hình 23. Kết quả của việc tẩy sạch để tạo nên một coverage mới
Ở hình bản đồ bên trái sau khi ghép nối còn có 7 polygon. Tuy nhiên thực tế
chỉ có 3 loại đất là ABC, sau khi kiểm tra toàn bộ các segment thì loại bỏ các
segmen grafi nối các polygon có cùng tên (cùng loại đất). Kết quả là các polygon
A được ghép lại, các polygon B cũng được ghép. Bản đồ kết quả chỉ cò 4 polygon
với 3 loại đất riêng biệt.
Đối với phân tích không gian, chức năng tẩy hay làm sạch hay được sử dụng
để thiết lập các mô hình. Trong trường hợp đó, một mô hình được thiết lập để mô
tả các mẫu không gian và hệ số đánh giá được sử dụng để hiệu chỉnh cho các đặc
điểm không gian. Mỗi đối tượng được xác định với một giá trị thuộc tính phù hợp,
căn cư vào hệ số đánh giá của mô hinh. Ranh giới giữa các đối trượng tiếp giáp
nhau mà có cùng tính chất thì được tẩy đi để tạo nên một mẫu không gian mới.
Chức năng tẩy sẽ được đề cập tiếp ở phần sau.
• Loại bỏ (Eliminate): chức năng loại bỏ được áp dụng phổ biến trong
trường hợp do lỗi của tư liệu có những đường không muốn được hình thành tạo
nên nhiều đường nhỏ và nhiều polygon nhỏ vụn (Sliver polygons). Tình trạng có
nhiều polygon nhỏ vụn thừa luôn xảy ra trong kết quả của việc chồng xếp các lớp
bản đồ. Khi có 2 polygon chồng lên nhau, do qua trình số hoá mà hai mảng thuộc
tính của hai lớp sẽ có xu hướng tạo nên nhiêu polygon nhỏ vụn.
Hình 24. Áp dụng chức năng loại bỏ để chỉnh sửa bản đồ.
Tạo vùng đệm từ các đối tượng polygon: khi mở rộng, hai polygon (bên trái)
sẽ tạo nên một polygon ở bên phải:
Hình 25. Tạo vùng đệm từ các đối tượng
Trong việc tạo vùng đệm chiều rộng của vùng đệm có thể tạo khác nhau cho
từng phần (đệm), đường (polygon) hoặc có các mức khác nhau song cũng có thể là
tạo tất cả giống nhau (nghĩa là cùng một chiều rộng). Ví dụ: khi nghiên cứu sự ô
nhiễm không khí, vùng mở rộng tính từ nguồn là một hàm của mức độ ô nhiễm
tính từ mỗi nguồn điểm. Trong trường hợp này, chiều rộng của vùng bị ô nhiễm sẽ
có cá mức khác nhau tuỳ theo mức ô nhiễm.
Lợi ích của việc tạo vùng đệm trong phân tích không gian là tạo nên các
vùng có cùng khoảng cách với một đối tượng lựa chọn. Chức năng này rất có ích
cho việc phân tích mối quan hệ về sự phân bố và tác động giũa các đối tượng
không gian.
Ví dụ, giả sử muốn nghiên cứu sự tương quan giữa các giá trị và khoảng cách
của mạng lưới giao thông huyết mạch (chính) thì khoảng cách của từng chỗ đến
đường giao thông gần nhất cần phải được xác định (hình)
Trong hình, các vùng có cùng khoảng cách tới đường giao thông chính được
vạch ra. Phương pháp này có thể áp dụng cho việc định giá đất tính từ đường giao
thông chính quy hoạch tưới tiêu tính từ sông hoặc để tính các vùng kế cận nhau.
Hình 26. Tạo các vùng đệm với các khoảng cách khác nhau
Phân tích sự gần gũi (Proximity analysis)
Phân tích sự gần gũi là công việc dựa vào cơ sở về khoảng cách của các
điểm lựa chon. Tạo một vùng mở rộng của một đối tượng, thông thường được
hiểu là việc tạo vùng đệm (buffer operation). Việc tạo vùng đệm có thể thực
hiện cho rất nhiều kiểu đối tượng, bao gồm cả điểm, đường và polygon. Vì quá
trình tạo vùng đệm là sự mở rộng về diện tích nên kết quả luôn tạo thành các
đối tượng polygon.
H×nh : Qu¸ tr ×nh t¹o vïng ®Öm cho ®èi t−î ng ® iÓm
H×nh : Qu¸ tr ×nh t¹o vïng ®Öm cho ®èi t−î ng ® −êng
area 7500
value 235-790
elevation = 347
Hình 29. Xác định độ cao của một điểm bằng con trỏ và màn hình
Công việc xác định đó cũng có thể thực hiện bằng cách dựa vào các thuộc
tính trong cơ sở dữ liệu. Việc xác định các đối tượng còn được gọi là lựa chọn đối
tượng (feature selection). Tóm lại, việc lựa chọn đặc điểm đối tượng có thể áp
dụng một cách linh hoạt, tuỳ điều kiện của người sử dụng.
Ví dụ: có thể căn cứ các điều kiện để lựa chọn trong mô hình không gian
(if...then), trong đó có một số đặc điểm sau:
9 Các đặc điểm có thể lựa chọn trực tiếp từ bản đồ: ví dụ có thể đưa con trỏ
chạy đến từng vị trí trên bản đồ để lựa chọn các đối tượng địa lý đồ hoạ.
9 Có thể lựa chọn theo thuộc tính theo vùng đánh dấu, ví dụ chọn các vùng
có cùng một số thuộc tích trong một bản đồ có nhiều vùng khác nhau.
Lựa chọn để tự tìm kiếm các đối tượng trong một vùng đánh dấu.
®èi t−îng ®iÓm
Hình 31. Kết quả nhom gộp các nhóm đối tượng
Trong đa số các trường hợp áp dụng, sự phân bố tần số được tính từ sơ đồ
phân loại đưa ra trước. Với sơ đồ đó ta có thể tiến hành gộp nhóm các đối tượng
hoặc phân tích, mô tả quy luật phân bố.
Với HTTĐL, việc phân tích tần số của bản đò cần phải có cơ sở dữ liệu với
nhiều thuộc tính hoặc nhiều đối tượng khác nhau.
Phân loại tư liệu (Data Classification)
Phân loại là công việc rất phổ biến trong xử lý dữ liệu không gian. Đó là một
trong những công việc tổ chức lại dữ liệu ban đầu với nhiều thuộc tính thành
những dữ liệu mới theo mục đích sử dụng. Trong phân loại, trước hết phải xác
định được số lớp cần chia, hoặc các ngưỡng cần phân chia. Tuỳ thuộc tần số phân
bố của các đối tượng mà có nhiều phương pháp phân loại khác nhau.
-Xác định quy luật phân bố tần số: có 6 mẫu phân bố cơ bản là: đồng nhất
(uniform), bình thường (normal), có hai cực trị (bimodal), đường thẳng xiên
(linearly Skewed), cong (non-linear slewed), nhiều lớp (multiple clusters).
Hình 33. Phân chia bản đồ thành các vùng theo hệ số chia mảnh khác nhau
Bản đồ gốc có cấu trúc lưới 5 x 5, mỗi ô có giá trị xác định.
Trong cả hai kết quả, bản đồ đều chia thành 3 lớp
Ở A: ρ = (8-1)(25 -1) = 0,29 (số vùng nhiều hơn = 8)
Ở B: ρ = (3-1)(25 -1) = 0,08 (số vùng ít hơn = 3)
Để tiện áp dụng, trong xử lý không gian, việc điều khiển một lớp thông tin và
nhiều lớp thông tin được tách thành hai chức năng riêng biệt trong phần mềm
HTTĐL. Tuy nhiên đa số trong thực tiễn, hai việc này đều phải được thực hiện
trong xử lý không gian.
Điều khiển một lớp thông tin thường là bước chuẩn bị tư liệu hay là biến đổi
các tư liệu gốc theo từng lớp để tạo thành một hay nhiều lớp thông tin cần thiết
cho bước xử lý tiếp theo.
Việc chuẩn bị dữ liệu đó phải dựa vào các thuộc tính của tư liệu. Thông
thường có 3 dạng chuẩn bị: điều khiển thuộc tính, phân biệt lựa chọn đối tượng và
phân loại đối tượng.
• Trước hết, việc điều khiên các đối tượng bản đồ có thể áp dụng nhiều
cạch. Với vùng rộng của các đơn vị tự nhiên thì phải chia nhỏ thành các phù vùng
với diện tích nhỏ hơn. Ngược lại, với các vùng quá phân tán thì lại phải gộp thành
càc vùng lớn hơn. Từng phần của tài liệu có thể được loại bỏ, bổ sưng thêm vào
hoặc lựa chọn để thích hợp với công việc xử lý tiếp theo.
• Thứ hai, các đối tượng bản đồ có thể phân biệt và lựa chon từ cơ sở dữ
liệu thông qua các phép toán quan hệ hoặc logic, công ivệc này sẽ tạo nên những
tư liệu mới cần thiết. Việc phân biệt và lựa chọn có thể thực hiện bằng phân tích so
sánh và áp dụng nhiều thuật toán, tuỳ thuộc vào đặc điểm của dãy tư liệu.
• Thứ ba, các đối tượng không gian có thể được phân loại trước khi phân
loại họăc thiết lập mô hình, áp dụng HTTĐL, bảng phân bố tần số của các đối
tượng không gian cần được thành lập và từ đó các phương pháp phân loại có thể
được lựa chọn và áp dụng.
Bài tập thực hành
Số hoá hoặc vẽ 2 bản đồ đường giao thông và ranh giới thành phố (không vẽ
các đường chấm rời là đường phân vùng của thành phố và ngoại ô).
A B
a e
b
Hình 35. Quan hệ logic giữa các lớp thông tin véctơ
Trong hình, tổ hợp hai lớp A (5 polygon) và B (3 polygon) sẽ cho C với 14
polygon. Ở C, thuộc tính ID của các đơn vị sẽ là cả thuộc tính của các lớp ban đầu
(nếu không chồng lên nhau) và thuộc tính tổng hợp với những đơn vị tạo nên do
chồng hai đơn vị của hai lớp ban đầu (ví dụ ID của lớp 1 là 4, của lớp 2 là 5 thì ở
C, đơn vị mới của 1 và 2 sẽ là tổ hợp, kể cả trong trường hợp không có ID mà chỉ
có tên gọi thì cũng tương tự (trong trường hợp hai lớp bản đồ khác nhau về tính
chất).
• Giao cắt (intersect): phép giao cắt trong thuật toán Boolean được
hiểu là phép quan hệ AND. Ý nghĩa cụ thể của quan hệ này như sau: khi có hai
thuộc tính của hai lớp được đưa vào bảng chồng xếp với AND thì chỉ có nhiều
phần thuộc tính nào được nhắc đến ở những lớp Input thì mới tồn tại ở lớp kết quả.
ở lớp kết quả, thuộc tính cùa các đối tượng là thuộc tính tổng hợp. Tóm lại, ý
nghĩa chính của INTERSECT là những lớp kết quả phải được tồn tại ở trên cả
những lớp ban đầu và phần giao cắt nhau.
1 1 1
2 3 2 2 3
4 5
3
6 7
4 5 8 9
A input(1) B input(2) C
output(kÕt qu¶)
1 1 1
2 2 5
3 3 4
2
6 7
3
8 9
4 5 11 12
11 14
Hình 37. Kết quả trong phép tính đồng nhất (Identity)
Ví dụ: xác định phân bố thực vật ở vùng phân bố động vật hoang dã tại khu
vực A (phân tích từ ảnh)
Sau khi phân tích ảnh, lập được 3 lớp bản đồ phân bố các loại thực vật chính,
ta lập bản đồ bằng phép identity để xác định mối liên hệ giữa phân bố động vật và
các loại thực vật chính trong khu vực. Kết quả sẽ có toàn bộ các loài thực vật
chính cả cả 3 lớp có ở trong vùng phân bố.
• Phân tích tính tần số hay mật độ (Frequency/density): Phân tích
không gian thường yêu cầu tính toán tần số (đếm) hay mật độ của đối tượng có ở
một lớp song lại được tính (hay đếm) ở một vùng nhất định thuộc lớp khác (lớp cơ
sở), dữ liệu của lớp ban đầu có thể ở dạng điểm, đường hoặc polygon. Ví dụ: tính
số cây xuấ hiện ở trong một vùng khoanh định. Để giải quyết vấn đề, phải có 2
lớp: lớp 1 - phân bố cây trong toàn vùng; lớp 2 - ranh giới khu vực cần nghiên
cứu.
Khi chồng xếp (overlay) 2 lớp sẽ tính được số cây trong vùng cần nghiên cứu
theo đơn vị diện tích. Trong trưòng hợp tính cho đường, thường tính theo độ dài
của đường mà không tính số lượng đường. Phép tính này hay sử dụng để nghiên
cứu địa chất. Sau khi xử lý xong, có thể tiếp tục thực hiện bản đồ phân bố mật độ
hoặc sơ đồ hoa hồng để phục vụ nghiên cứu đứt gãy - kiến tạo. Ngoài ra có thể áp
dụng cho việc nghiên cứu mật độ đường giao thông, nghiên cứu phân bố dân tộc
hặc phân bố các loài động thực vật.
Tương tự như vậy, có thể tính toán mật độ cho polygon. Phép tính này có thể
áp dụng cho nhiều nội dung nghiên cứu khác nhau: chẳng hạn để nghiên cứu sự
tập trung (đồng nhất) hay phân tán của một số loài thực vật trong một khu vực
nhất định.
¾ Phân tích quan hệ gần gũi:
Quan hệ gần gũi có thể được phân tích nước cách, tuỳ thuộc vào đặc điểm
đối tượng. Sự gần gũi giữa các polygon có thể được tính bằng phương pháp
khoảng cách tách biệt chung (interseparation distance), cụ thể hơn đó là khoảng
cách tách biệt giữa chu vi các polygon, hay khoảng cách giữa cá vị trí trung tâm
(centrer locations). Việc nghiên cứu khoảng cách giữa các điểm trung tâm được
thực hiện theo nguyên tắc đo khoảng cách giữa các điểm. Việc đo quan hệ gần gũi
giữa các đường được thực hiện trong việc phân tích mạng lưới. Trong phần này,
nội dung xử lý được áp dụng chỉ cho các đối tượng điểm mà thôi.
¾ Quan hệ gần (NEAR): Chức năng NEAR trong xử lý HTTĐL có khả
năng phát hiện các điểm hoặc đường trong một lớp với một điểm ở trong lớp khác
và tính toán khoảng cách tới điểm đó.
x
x
x
x x
Hình 38. Sơ đồ hàm NEAR tính khoảng cách một điểm tới đường gần nhất
Mối quan hệ NEAR có thể dùng để xác định vị trí gần nhất tới một đối tượng
đường hoặc điểm, đây là những tính toán trong việc thiết kế các điểm cấp nước,
các chòi canh chống lửa cháy trong rừng.
¾ Tính khoảng cách các điểm (Point Distance): Thuật toán này dùng
để tính khoảng cách giữa các điểm ở lớp này tới điểm khác ở lớp khác. Cũng có
thể áp dụng tính toán này cho một lớp.
x
x
x
x x
32
28
24
20
1 2 3 4 5
Kho¶ng c¸ch (km)
Hình 40. Tinh toán khoảng cách giữa các vị trí khác nhau
Ở đây: n là số lượng các đơn vị bản đồ (trong bảng n = 8)
Sx và Sy là độ lệch chuẩn của x và y
x là giá tiền và y là khoảng cách
r sẽ có giá trị thay đổi từ -1 đến 1.
Nếu giá trị đó dương thì quan hệ đó là tỉ lệ thuận và ngược lại, r âm thì quan
hệ là tỉ lệ nghịch.
Nếu r =1 thì quan hệ rất chặt. Nếu r = 0 thì không có quan hệ.
Tóm lại, một yêu cầu cơ bản của HTTĐL là phải có khả năng xử lý tư liệu và
tổ chức thành những lớp riêng biệt, có quan hệ logic. Sự phân bố của cá hiện
tượng địa lý là phức tạp và bao gồm nhiều yếu tố có quan hệ theo nhiều phương
thức khác nhau. Một trong những chức năng của HTTĐL là phân tích được
phương thức phân bố của các yếu tố thông qua các số liệu. Xử lý nhiều lớp thông
tin cho phép tách biệt hoặc kết hợp để xử lý một cách hiệu quả các số liệu thống
kê ban đầu.
Trong xử lý nhiều lớp thông tin có một số phương thức cơ bản là chồng xếp,
xác định sự gần gũi và xác định quan hệ đó. Thuật toán Boolean được áp dụng
tương đối phổ biến trong các phép xử lý đó.
• Phép chồng xếp là thiết lập sự liên kết không gian giữa các lớp tư liệu
riêng biệt, từ đó liên kết được các yếu tố khác nhau.
• Phân tích sự gần gũi là phân tích và thiết lập cá khoảng cách lân cận, tạo
nên những lớp thông tin mới.
• Phân tích quan hệ là xác định mối liên quan giữa các hiện tượng và sự
phân bố không gian của các đặc điểm khác nhau giữa một hay nhiều lớp tư liệu.
BÀI TẬP
1. Số hoá bản đồ đất và thực vật có nội dung như sau:
- Bản đồ đất có các loại đất được gọi tên theo số 101, 102, 103, …
- Bản đồ thực vật có: đất cỏ, thông, sồi, …
- Chồng xếp hai lớp theo chức năng tổ hợp (Union), tạo bảng tổng hợp
sự phân bố và bảng dự báo.
§Êt thùc vËt
101
102
103
101
Cá
Th«ng
Såi
1
a b
2
d
c 3
Ở đây: So = ∑ i ∑j δịj
Giá trị dự kiến và độ lệch được tính như sau:
E (1) = −(n − 1) −1
n 2 S1 − nS 2 + 3So 2
I=
So 2 (n 2 − 1)
Ở đây: S1 = (1/2) ∑ i ∑j (δij - δij )2
S2 = ∑i (∑i δij - Ej δji)2
n là số đơn vị địa lý - hay là số điểm
δij: hệ số liên hệ không gian giữa điểm thứ i và thứ j
Xi: tần số phân bố không gian
So: tổng số cặp có trong quan hệ không gian
Giá trị hệ số i thường thay đổi từ -1 đến 1. Nếu giá trị i là dương là lớn (<=
1) thì phân bố theo nhóm nếu i là <= 0 thì phân bố là phân tán. Khi i = 0 thì không
có quan hệ và khi đó phân bố là ngẫu nhiên.
Hai ví dụ nêu trong hình trên không có sự khác biệt nếu dùng hệ số poisson,
song nếu dùng hệ số i của Morans thì sẽ tính được i = -95 cho hình bên trái vì đó
là phân bố theo nhóm và quan hệ đó là chặt. Còn cho hình bên phải, i có giá trị -
2,1, đó là đặc trưng cho phân bố phân tán.
Một việc cần chú ý trong việc tính quan hệ không gian là độ chính xác của
việc tính toàn còn phụ thuộc vào độ phân giải của các ô được chia ra. Trong một
số trường hợp hệ số i không thể áp dụng cho việc tính với phân bố của điểm.
Trong khi nghiên cứu, cần có sự so sánh giữa hệ số i với các hệ số khác như hệ số
gần gũi NNI (Nearest Neighborn Index) hoặc giá trị thống kê Poisson, từ đó có thể
đưa ra những kết luận phù hợp.
Lấy mẫu các đối tượng điểm
Việc lấy mẫu là rất quan trọng trong phân tích mẫu điểm, đặc biệt là khi tư
liệu có khối lượng lớn. Nếu thuộc tính không gian có thể khai thác được từ một
mẫu thì không nhất thiết phải xử lý toàn bộ các đối tượng và thông thường điều đó
khó thực hiện vì không thể lấ toàn bộ mẫu. Chẳng hạn để xác định độ cao địa hình,
phải đo theo các điểm lựa chọn chứ không thể đo độ cảo ở khắp mọi nơi.
Một trong những ứng dụng quan trọng khác của việc lấy mẫu không gian là
sự ngoại suy trong xử lý không gian. Về mặt lý thuyết, phải lựa chọn phương pháp
ngoại suy thích hợp đối với từng hệ thống mẫu. Vì vậy trong lấy mẫu có nhiều
phương pháp khác nhau.
• Lấy mẫu phi không gian: là việc lấy mẫu không có tham khoả các hợp
phần không gian. Ví dụ: trong marketing, có thể chào hàng một cách bất kỳ theo
số điện thoại ở danh bạ mà không cần tham khảo bản đồ. Tuy nhiên các mẫu này
vẫn được sử dụng trong xử lý không gian.
• Lấy mẫu không gian: HTTĐL sẽ trở nên có hiệu quả cao nếu xử lý một
hệ thống mẫu được lấy theo nguyên tắc không gian, nghĩa là có sự tham khảo các
yếu tố địa lý khi lấy mẫu. Ví dụ: nếu điều tra về hộ trong vùng ngoại ô, có thể sử
dụng tài liệu điều tra theo các tuyến, sau đó lựa chon ngẫu nhiên 10% chủ hộ trong
mỗi tuyến để phỏng vấn. Như vậy kết quả sẽ sát thực tế hơn là việc lựa chọn ngẫu
nhiên theo số điện thoại cứ cách 10 số lại hỏi 1 số.
Số lượng điểm lấy mẫu có thể là ngẫu nhiên. Trong trường hợp toàn bộ các
điểm đều có các giá trị ID riêng và khi đó việc lấy mẫu vẫn được coi là phi không
gian vì việc xử lý sẽ không tham khảo yếu tố hình học.
Song song với việc lấy mẫu trên, một mẫu ngẫu nhiên có thể được lấy riêng
biệt bằng cách xác định toạ độ của từng điểm rồi đưa lên bản đồ, sau đó lựa chọn
các mẫu theo từng phương thức. Ví dụ khi lấy mẫu theo vòng tròn với bán kính
nhất định. Trường hợp đó chỉ lấy các điểm ở trong vòng tròn hoặc lấy theo vùng
đệm của đường, của điểm.
Việc lấy mẫu phi không gian hoặc không gian có thể được thực hiện một
cách ngẫu nhiên hoặc có hệ thống. Trong trường hợp lấy mẫu hệ thống thì sự phân
bố điểm không thể là ngẫu nhiên. Ví dụ: muốn nghiên cứu điều kiện xã hội ở vùng
ngoại ô, một tập mẫu gồm 1000 hộ được phỏng vấn từ 200 tuyến điều tra. Đối với
mỗi tuyến việc điều tra có thể là ngẫu nhiên, song đối với toàn vùng thì sự phân bố
các điểm số liệu đó không được coi là ngẫu nhiên mà có thể là phân bố theo nhóm.
Tổ hợp không gian: trong phân tích mẫu điểm phân tích tổ hợp không gian là
phân tích mối quan hệ giữa cá yếu tố điểm và một loạt các yếu tố khác. Trong tổ
hợp không gian, các điểm phải được giới hạn trong các yếu tố polygon để tiện so
sánh đánh giá, ví dụ nghiên cứu bằng các kỹ thuật giật lùi (Regression
Techniques), các bước tiến hành cụ thể như sau:
• Bước đầu tiên là xác định các đơn vị địa lý, các đơn vị này được chia theo
các hệ thống chú giải thích hợp.
• Khoảng cách giữa các điểm.
• Bước thứ ba: phân loại các nhóm điểm căn cứ vào các thông số phân tích
được.
• Bước thứ tư: chồng xếp các lớp thông tin điểm và polygon.
• Bước thứ năm: phân tích kết quả chồng xếp và tính toán dự báo.
• Bước cuối cùng: kiểm tra đánh giá kết quả phân tích và kết quả dự báo.
• Phân tích phân bố điểm trong HTTĐL là quá trình quan trắc sự phân bố
theo nguyên tắc thống kê, kiểm tra sự sắp xếp trong không gian của các đối tượng
điểm và phân tích đặc điểm phân tích đặc điểm phân bố không gian của các mẫu
điểm bằng phương pháp xử lý thông kê mối quan hệ không gian. Ngoài ra, trong
nghiên cứu về điểm, HTTĐL cũng yêu cầu việc lựa chọn và lấy mẫu điểm theo
những nguyên tắc phù hợp với các yêu cầu xử lý không gian.
BÀI TẬP
1 - Căn cứ theo bảng sau so sánh các mẫu không gian dựa theo hệ số gần gũi
(NNIS)
a b a b
2 4 5 2 4 4 5
4
6 6 6 6
7 7
7 7
5 5
1 3 1 3
1 3 1 3
2 2
2 - Xác định xem 3 kiểu phân bố ở phía dưới sơ đồ sau là kết quả của phân
bố ngẫu nhiên hay không - sử dụng phân tích chia 4 của poisson để phân tích.
3 - Tính hệ số Marran cho 3 kiểu phân bố điểm thể hiện trong phương trình
trên (của câu 2), so sánh các giá trị.
4 - Số hoá các điểm phân bố trong hình dưới, xác định toạ độ x và y của các
điểm (sử dụng chức năng addxy) trong ARC/INFO để tạo toạ độ. Trường hợp
không có toạ độ thì đưa tạo độ tương đối thay thế. Trên cơ sở toạ độ, xác định giá
trị thống kê của trung tâm điểm và độ lệch chuẩn cho toạ độ x và y và mô tả mẫu
phân bố không gian. Tính toán hệ số NNIS của phân bố.
Hình 46. Mô tả đường đi thuận lợi trong mmo hình cấu trúc raster
Có thể thấy rằng, về thông tin một lớp, có loại thông tin chính cần được xử lý
là vùng (area), điểm (point) và đường (line). Những tính chất cần được xác định về
các thông tin đó là sự phân bố, sự liên hệ và định hướng.
Hình 47. Các đường đồng mức độ cao trên mmô hình nổi 3D
Nếu nhìn từ đỉnh thì các đường có cùng giá trị xuất hiện gần như song song
với nhau. Nếu chúng chạy vòng quanh các đối tượng địa hình như đồi, thung lũng
thì các đờng đó sẽ khép kín, hoặc sẽ tiếp tục chạy vòng xung quanh đối tượng đến
mép bản đồ. Các đường cùng giá trị đó (đường đồng phức) giúp ta hình dung được
hình dạng các đối tượng hoặc các trạm trổ chính trên bề mặt đối tượng: đường
sông núi, thung lũng … Ngoài ra dựa vào khoảng cách giữa các đường có thể dự
đoán về độ dốc của địa hình. Một số phần mềm xử lý vector cho phép dễ dàng tạo
nên các đường đồng mức như vậy.
Lấy mẫu cho bản đồ thống kê
Để tạo lập bản đồ các đường đẳng trị, tại liệu phải được thu nhập từ các vị trí
điểm. Để lấy mẫu điểm, trước hết phảI lấy mẫu với mật độ … bằng hệ thống ô
lưới bằng nhau, phổ biến là tạo lưới với ô hình tam giác.
• Với bề mặt nhẵn, lấy mẫu theo nguyên tắc lưới đều.
• Với bề mặt nhám, phải lấy mẫu theo nguyên tắc tạo lưới không đều. Ở
những vị trí có sự thay đổi lớn của độ cao z phải lấy mẫu dày hơn.
Mô hình độ cao số (Digital Elevation Model-DEM)
Khi đã có tư liệu tại các mẫu điểm, công việc tiếp theo của việc xây dựng bề
mặt đó là việc mô tả hình độ cao số bằng các phần mềm HTTĐL. Qua trình đó có
thể thực hiện với cơ sở dữ liệu vector (TIN model trong ARC/INFO) hoặc cơ sở
dữ liệu Raster (image model).
• Dữ liệu đưa vào xử lý có thể là điểm, là đường hoặc vùng, với các giá trị
độ cao khác nhau. Trong quá trình xử lý, các dữ liệu đó được bố trí thành các điểm
riêng biệt với các giá trị độ cao khác nhau. Quá trình đó được gọi là tạo ra ma trận
độ cao tách biệt (discrete altitude matrix). Ma trận này là ma trận đều (iregular
lattice).
• Ma trận độ cao tách biệt được đưa vào xử lý trong mô hình độ cao số.
Một công việc quan trọng của tạo mô hình đó là nội suy (interpolation). Nội suy là
công việc tính độ chênh cao giữa các điểm và khoảng cách giữa các điểm trong
mạng lưới, từ đó tính được toàn bộ giá trị độ cao của ma trận. Đó là qúa trình bổ
sung giá trị độ cao cho toàn vùng. Công việc này có thể được áp dụng để lập bản
đồ độ cao tỉ lệ 1:250 000 với ô lưới là 63,5 mét hoặc tỉ lệ lớn hơn khi phân tích đo
lập thể ảnh máy bay.
Hình 48. Mô phỏng hai kiểu bề mặt địa hình dạng Raster và Vector
Với tư liệu Raster, bề mặt dược chia thành những đơn vị nhỏ gọi là ô lưới
(cell), mỗi ô lưới có một giá trị độ cao riêng. Như vậy tại liệu lirn tục được tách
thành những phần riêng biệt, mỗi phần đó là một ô lưới và mỗi ô chiếm một không
gian nhất định của bề mặt (hình 10.4 trong sách). Muốn có độ chính xác cao về độ
cao thì bề mặt Raster phải được chia thành các ô nhỏ hơn và đó là tương quan tỉ lệ
thuận.
Trong bề mặt Raster, một điều cần chú ý là giá trị z được xác định cho vị trí
nào của ô lưới. Thông thường là ở vị trí giữa ô, song cũng có thể ở 4 góc. Từ đó
cũng có thể xác định tiếp các giá trị khác nhau như: khoảng cách, độ dốc, hướng
dốc.
Hình 49. Các phương thức tạo bề mặt và phân tích bề mặt
Hình 50. nội suy các ô lưới giá trị để tạo bề mặt có độ cao khác nhau
Trường hợp bề mặt không nhẵn thì nhiều ô bị thiếu dữ liệu, nên phải bổ sung
dữ liệu về độ cao. Quá trình đó được gọi là quá trình nội suy (interpolation).
Các phương pháp nội suy
Về nguyên tắc nội suy là công việc dựa trên một nguyên tắc rất đơn giản
song lại yêu cầu có những giả định ưu tiên.
Trước hết hãy quan sát tần số xuất hiện về mặt toán học của dãy số sau:
12345678910
Trongdãy số đó, mỗi số tiếp sau hơn số đằng trước một giá trị là 1. Tần số
như vậy được gọi là tần số tuyến tính hoặc tần số số học vì nó tăng thêm mỗi lần
cùng1 giá trị, giá trị thêm vào là 1.
Với một dãy khác: 10 20 30 40 50 60 70 80 90 100 thì 10 là giá trị gia tăng
của mỗi bước hoặc với dãy số sau:
1000 900 800 700 600 500 400 300 200 100
thì 10 là giá trị giảm đi của mỗi bước. Tương tự như vậy biến đổi các số có
thể là theo nguyên tắc nhân, chia…
• Nội suy tuyến tính (linear interpolation)
Với những dãy số trên, nếu có những giá trị bị mất thì ta có thể dễ dàng bổ
sung nếu tìm ra được quy luật của dãy số, đó là quá trình nội suy theo tuyến tính.
Phương pháp làm là vẽ đường vuông góc cắt qua đường 100 và 150 rồi chia
thành 5 đoạn, từ đó bổ sung các điểm và giá trị còn thiếu và vẽ các đường Contour
qua các điểm bổ sung đó.
Tuy nhiên, việc nội suy theo tuyến tính chỉ thực hiện được trong những ví dụ
hẹp và bề mặt là liên tục và nhẵn. Thông thường độ chính xác của phép nội suy
theo tuyến tính là không cao vì trong thực tế mối liên quan về giá trị độ cao của
các điểm thường theo những hàm toán phức tạp hơn.
• Nội suy không tuyến tính (Nonlinear interpolation)
Nội suy không theo tuyến tính được thiết kế để áp dụng cho những trường
hợp được coi là không tuyến tính. Trong kỹ thuật nội suy không tuyến tính có 3
phương pháp chính là: trọng số (weighting), mặt phẳng hướng (Trend surface) và
Kriging. Đã có nhiều sách viết khá kỹ về vấn đề này, nên ở đây chỉ đề cập những
vấn đề chính.
• Phương pháp nội suy trọng số (Weighting interpolation method)
Tiếp cận của phương pháp này là mỗi vị trí trên bề mặt có những tính chất
hình học tương tự như của những điểm ở gần, đặc biệt là về độ dốc. Để hình dung
rõ khái niệm này, ta lấy ví dụ của trường hợp đi lên dốc và đi xuống dốc. Khi lên
dốc ta có cảm giác về độ cao các điểm ở gần là giống với độ cao vị trí ta đang
đứng, cảm giác đó sẽ rất khác khi so với các điểm ở xa. Khi xuống dốc, cảm giác
đó cũng tương tự. Khi xuống tới đáy dốc, ta cũng có cảm giác độ cao thay đổi đột
ngột.
Hình 51. Cách nội suy theo nhièu hướng để tính các yéu tố trắc lượng hình thái
Để thể hiện chính xác hơn địa hình, ta lựa chọn từ các điểm đã biết giá trị độ
cao ta nội suy để từ đó biết các giá trị độ cao của một điểm lân cận ở giữa tạo nên
một bề mặt của địa hình. Có nhiều phương pháp để nội suy: tạo một khoảng cách
hoặc một đường tròn có tâm là các điểm. Các điểm này được lựa chọn từ các điểm
mẫu hoặc lựa chọn số … nhất định các điểm trong các ô lưới vuông hoặc ô hình đa
giác – nghĩa là chọn một điểm cho một ô để nội suy. Với bất kỳ phương pháp nào,
máy tính cũng phải đo khoảng cách giữa mỗi cặp điểm từ mỗi nhân của ô hay từ
một điểm xuất phát. Độ cao của mỗi điểm được xác định bởi bình phương của
khoảng cách. Vì vậy nếu các điểm ở gần nhau thì giá trị tính được sẽ chính xác
hơn. Về nguyên lý là như vậy song trong thực tế áp dụng, có nhiều cách khác
nhau: có phương pháp áp dụng để giảm bớt số lượng các điểm đo, có phương pháp
tạo trọng số hơn là tính bình phương, có phương pháp tạo các gờ như đường bờ
biển, vách núi… để quá trình nội suy không vượt qua được. Phương pháp tạo gờ
cho phép nội suy từng vị trí riêng biệt. Trong nhiều phương pháp thì phương pháp
hay được áp dụng nhất là tạo các hướng trong bề mặt có độ cao z hơn là những
phương pháp cho cục bộ từng khu vực.
Bề mặt hướng thường được áp dụng cho một khu vực nhất định. Một mặt
phẳng độc nhất thường được tạo nên bởi các phương trình toán hoạ như:
polynominal hay spines. Các phương pháp này cho phép tính không tuyến tính mà
theo quan hệ đường cong hoặc những quan hệ số học khác. Để tạo lập nên mặt
hướng (trend surface), các trị số trong vùng được tính sao cho phù hợp với phương
trình toán học. Giá trị đơn giản nhất là tính cho các nhân kernel, từ đó tính cho
toàn vùng để tạo nên mặt phẳng. Giá trị của các nhân ô lưới (Kernel) có thể đơn
giản là trung bình của các giá trị trong vùng mà hướng đI qua, hoặc có thể lấy
trọng số giữa chúng tuỳ theo khoảng cách. Thông thường mặt phẳng hướng là rất
nhẵn và nó thể hiện toàn hướng cho tất cả mọi giá trị của đối tượng hoặc nó có thể
biểu thị một quan hệ phức tạp giữa các thuộc tính của đối tượng. Kiểu công thức
được sử dụng sẽ xác định số lượng những phần lượn sóng ở trên bề mặt. Mặt
phẳng hướng đơn giản thường có độ dốc nhỏ và có một hướng và gọi là bề mặt
trường mức độ thứ nhất. Nếu bề mặt hướng có hai hướng thì được gọi là bề mặt
trường mức độ thứ hai.
Phương pháp nội suy Kriging: Đây là phương pháp tối ưu để nội suy dựa vào
cách tính toán thống kê của bề mặt (Oliver 1990). Kriging sử dụng khái niệm về
sự khác biệt có tính chắt vùng (Blais và Carier 967, Matheran 967) với sự khác
nhau từ nơi này sang nơi khác song vẫn có sự liên tục. Đặc điểm này không thể tạo
lập mô hình được theo nguyên tắc của phương trình toán học tạo bề mặt nhám đơn
giản. Trong thực tế, hiện tượng này rất phổ biến đối với các đối tượng tự nhiên.
Chẳng hạn như các trường phân bố quặng, chất lượng đất và ngay cả trong thực
vật học cũng có hiện tượng phân bố như vậy.
Kriging tạo lập nên bề mặt phức tạp với 3 giá trị riêng biệt:
• Giá trị thứ nhất được gọi là độ lệch (hoặc sự trôi dạt) hay cấu trúc của bề
mặt, giá trị này tạo một bề mặt cơ sở như một trường trong một hướng bất kỳ.
• Giá trị thứ hai được đưa ra nhằm tổng hợp những sự khác biệt nhờ trong
bề mặt chung, ví dụ như những chỗ nhô lên hoặc lõm xuống nhỏ trong bề mặt,
chúng xuất hiện ngẫu nhiên song lại có quan hệ với một khoảng không gian khác.
Công việc này được gọi là tự động hoá liên hệ không gian.
• Giá trị thứ 3 là giá trị để chỉnh lý những nhiểu ngẫu nhiê không có liên
quan tới hướng chung cũng như tự động liên hệ không gian Clarke (1990) đã minh
hoạ cho ý nghĩa của giá trị nàybằng hình tượng tương tự là: nếu ta leo núi, sự thay
đổi địa hình theo hướng nhìn lên từ điểm khởi đầu đến đỉnh núi đựpc gọi là độ trôi
dạt hay cấu trúc của bề mặt. Dọc đường trèo ta gặp nhiều chỗ lồi lõm cục bộ xuất
hiện ngẫu nhiên song vẫn có liên hệ chặt vơí độ cao của địa hình. Đôi chỗ ta thấy
có những tảng đá dốc đứng. Hiện tượng đó được gọi là nhiễu về độ cao bởi vì
chúng không có liên hệ trực tiếp với bề mặt. Cấu trúc ở phía dưới do độ cao của
chúng thay đổi đột ngột ngay từ trí đầu tiên gặp chúng.
Ba phương pháp nội suy đã nêu ở trên được thực hiện một cách độc lập.
Phương pháp trôi dạt (drifit) sử dụng phương trình toán học thể hiện sự thay đổi
chung trên bề mặt và gần giống như mặt hướng (trend surface). Độ cao dự kiến
được đo bằng kỹ thuật đồ thị thống kê gọi là Semivenogram. Đồ thị này chấm các
khoảng cách giữa các mẫu gọi là Lag(h) (sự tụt hậu) của độ cao, trên trục nằm
ngang. Trục thẳng đứng có các giá trị nửa khác biệt (semivaince), giá trị này là 1/2
sự khác biệt (tính bằng bình phương của độ lệch chuẩn) giữa mỗi giá trị độ cao của
một điểm lân cận. Giá trị này là một trị số của sự phụ thuộc lẫn nhau về giá trị độ
cao, nó liên quan đến sự ở gần xa giữa chúng.
Đặc điểm thứ 3 quan trọng của đồ thị bán khác biệt (semivariogram) này là
đường cong chuẩn, không chạy trực tiếp qua điểm gốc. Cả thuật toán và cách tiếp
cận đều xuất phát từ ý nghĩa là nếu không có sự khác biệt và giá trị sẽ làcủa 1
điểm mà thôi. Vị trí đường cong chỉ là tương đối nên sự khác biệt giá trị 0 ở trong
sơ đồ và các giá trị đương dự kiến chỉ là sự giả định cho việc xuất hiện những
nhiễu khác biệt không có sự liên hệ, các nhiễu đó gọi là sự khác biệt chi tiết
(nugget variance). Sự khác biệt đó là sự tổng hợp những sai số đo cùng với những
sai số không gian xuất hiện ở những điểm có khoảng cách ngắn hơn so với khoảng
cách của mẫu và những nhiễu đó là không xử lý hết được (Theo Bourrongh 1986).
Ba thông số vừa nêu ở trên của phương pháp sơ đồ bán khác biệt là rất quan
trọng cho việc xử lý nội suy cho khu vực. Khi nội suy cho từng vùng phải tính
thêm giá trị trọng số. ở đây việc lựa chọn trọng số là phải nhằm loại bớt những sự
khác biệt có thể có cho mối liên hệ tuyến tính về độ cao của tệp mẫu. Giá trị này
có thể xác định được tiếp từ mô hình tạo đồ thị bán khác biệt (semivariogam) của
toàn khu vực.
Phương pháp Kriging có 2 dạng chính:
• Dạng chung hay tổng quat (general Kriging) còn được gọi là universal
Kriging: là phương pháp hay được sử dụng nhất khi tạo mặt phẳng dự kiến cho
những mẫu có sự phân bố không đều (irregular) hay còn gọi là không ổn định.
• Dạng ngắt đoạn (Punctage Kriging) là dạng ban đầu được áp dụng với
quan niệm là số liệu ổn định (không có hướng) đồng nhất và phân bố trong không
gian đều. Phương pháp này chủ yếu là dùng để nội suy các số liệu điểm khác hơn
là để tạo bề mặt.
Kriging là một phương pháp nội suy chính xác giúp cho việc đo đạc đúng
những giá trị độ cao bị mất, nó còn có ưu thế là tính nhanh và tính đúng. Nó còn
có ưu điểm hơn so với các phương pháp nội suy khác là nó không chỉ nội suy các
giá trị nội suy mà nó còn xác định được tổng số những lỗi trong kết quả. Tuy
nhiên trong trường hợp những lỗi do đo đạc quá nhiều thì Kriging khó tính được
sơ đồ khác biệt và khi đó Kriging cũng thực hiện không tốt hơn các phương pháp
khác.
Tuy nhiên, mỗi một phần mềm HTTĐL đều cung cấp ít nhất là một phương
pháp nội suy để xử lý số liệu độ cao. Trong HTTĐL sử dụng dữ liệu Vector, mô
hình TIN thường giúp ta trình bày dễ dàng những điểm có cùng giá trị và tổng hợp
các giá trị độ cao của chúng, chuyển thành ma trận điểm về độ cao (đôi khi gọi
đơn giản là số liệu điểm).
Từ số liệu của ma trận điểm, có thể lựu chọn dễ dàng các phương pháp nội
suy để tạo mặt phẳng. Đối với các phần mềm sử dụng tài liệu Raster thì các số liệu
điểm được biến đổi thành các số liệu của các nhân và các nhân bị thiếu số liệu sẽ
được tính và gán cho theo nguyên tắc nội suy từ các nhân kế cận. Nếu như phần
mềm không có mô đun xử lý thích hợp, ta có thể biến dổi số liệu để xử lý trong
phần mềm chuyên dùng về nội suy. Kết quả tạo được đó lại được chuyển về phần
mềm ban đầu để xử lý. Giới thiệu chung về nội suy có một só sách của các tác giả
như Lan (1983) hay Flowerdew và Grean (1992).
Ứng dụng của nội suy
Ngoài các kỹ thuật nội suy đã nêu ở trên còn có các kỹ thuật khác như tạo
bóng, tạo hướng dốc … Tuy nhiên, công việc đó chỉ thực hiện được một khi các
phần mềm có các chức năng đó.
Trong thực tế, khi nào thì cần làm nội suy? Đó là vấn đề đặt ra của việc ứng
dụng. Có thể đưa ra một vài ví dụ tham khảo sau:
• Xác định các vùng ngập với tần số xuất hiện là 100 năm, trong điều kiện
chưa có bản đồ để tham khảo, biết rằng mức ngập là cao 100 m trên mực nước
biển. Kết quả sẽ giúp cho việc lập các khu định cư cho an toàn. trong số liệu chỉ có
một giá trị độ cao nhất định đã có từ trước khi xây dựng nhà cửa. Bằng phương
pháp nội suy, có thể bổ sung số liệu cho các điểm khác trong khu vực từ đó lập ra
được các đường đồng mức, trong đó có đường 100, chính là ranh giới cần xác
định.
• Mở rộng đường giao thông trong trường hợp không có bản đồ, phải mở
đường trên cơ sở lựa chọn hướng dốc thích hợp. Nội suy sẽ giúp lập được bản đồ
độ cao, bản đồ độ dốc và bản đồ hướng dốc.
• Trong tìm kiếm các vỉa quặng, ta chỉ có một số liệu về độ cao xuất hiện
giả đáy và rtần thân quặng, bằng việc nội suy tạo được một bề mặt có độ dốc thân
quặng khác với bề mặt che phủ bên trên. Từ đó có thể xử lý tiếp để tính toán toàn
bộ quy mô của thân quặng. Hoặc dễ hiểu và đánh giá về chất lượng các vành phân
tán quặng, từ số liệu mẫu từ các điểm sẽ nội suy để tạo ra các đường đẳng trị về
hàm lượng mẫu.
Tóm lại trong nghiên cứu địa lý, nội suy được áp dụng để xác định các vùng
trên bề mặt có giá trị z khác nhau. Giá trị z đó có thể là hàm lượng Nitơ trong đất,
mức độ phát triển của thực vật từ một nguồn cung cấp độ ẩm, mật độ dân số ở các
vùng, mức độ ô nhiễm môi trường từ một số nguồn phát thải. Phương pháp nội suy
cung cấp khả nămg cần thiết trong việc xử lý số liệu nhằm phục vụ cho nhiều nội
dung nghiên cứu khác nhau của khoa học địa lý, địa chất và môi trường.
Một số vấn đề cần quan tâm trong nội suy
Trong việc nội suy, có 4 vấn đề cần phải được quan tâm đến là:
- Số lượng các điểm khống chế (có số liệu).
- Vị trí của các điểm khống chế.
- Các vấn đề về điểm uốn (điểm tạo các số đất).
- Diện tích có các điểm tài liệu.
Nói chung, có thể thấy một điều rõ ràng là nếu số lượng mẫu có nhiều thì kết
quả nội suy sẽ chính xác hơn và kết quả sẽ gần đúng nhất với thực tế. Tuy nhiên,
vấn đề đặt ra là số lượng mẫu tối thiểu là bao để đủ cho việc nội suy. Mặt khác
trong thực tế cũng cho thấy nếu qúa nhiều mẫu thì việc xử lý sẽ mất nhiều thời
gian và cũng chưa phải là có kết quả tốt hơn. Đôi khi quá nhiều mẫu lại dẫn đến
xuất hiện nhiều mẫu hoặc sai số. Kết quả là mặt phẳng tạo được tượng tự nhiễu, do
đó kết quả là không chính xác.
Đặc điểm của đường cong lý thuyết về sự liên hệ giữa số lượng điểm và độ
chính xác của bản đồ nội suy (với bản đồ isarathmic) tạo các đường đẳng trị. Vị trí
các điểm mẫu thường có tác động rất nhạy cảm tới kết quả nội suy. Khi mà tập
mẫu điểm của một sự phân bố tương đối bằng phẳng thì đơn giản nhất là sử dụng
phương pháp trung nhân tâm (centroid – of – cell method). Khi đó, phần mềm cho
phép tạo lưới và xác định các nhân để gắn giá trị. Còn với phân bố theo vùng hoặc
không bằng phẳng thì phải áp dụng phương pháp nội suy theo các tâm trọng số
(centre of gravity method). Cả hai phương pháp đều hay xảy ra trường hợp là có
một số tâm điểm lại nằm ngoài các vùng nghiên cứu, đặc biệt là trong trường hợp
phân bố không đều thì cách đơn giản là nhấc những điểm nhân đó vào trong vùng,
ở vị trí gấn nhất có thể được. Những thao tác này thường được áp dụng một cách
linh hoạt trong xử lý.
Các điểm sống đất (tạo yên ngựa): Đôi khi gọi là các điểm xen kẽ, xuất hiện
khi hai cặp giá trị z ngược với nhau, tạo nên một góc vị trí của giao điểm có giá trị
lớn hơn hai giá trị của một cặp điểm thứ nhất và nhỏ hơn giá trị của một cặp điểm
thứ hai. Việc nội suy nhằm tìm và gắn giá trị α cho điểm đó-điểm ấy được gọi là
điểm yên ngựa. Điểm này hay gặp trong việc nội suy theo khoảng cách. Khi vấn
đề điểm sống đất xuất hiện, phần mềm máy tính thường đưa ra hai cách giải quyết
thích hợp để tạo nên contour. Cách đơn giản nhất là lấy giá trị trung bình của 4
điểm ở bốn góc và đặt vào giao điểm để nội suy.
Hình 52. Bảo đồ độ cao địa hình và mô hình 3D với dữ liệu là đường đồng mức
(Phần ngoài rìa bị nhiễu do không có số liệu)
Vấn đề cuối cùng cần được xem xét trong nội suy đó là những vùng nằm bên
trong của số liệu mẫu điểm. Để việc nội suy có kết quả hoàn hảo, trong tập số liệu
phải có những điểm khống chế. Thông thường, nếu ta lựa chọn vùng nghiên cứu
có cùng diện tích với cùng nội suy, ta phải xử lý nội suy cho những điểm ngoài rìa
của vùng. Khi đó sẽ có một số hướng của điểm khống chế bị phân rìa ngăn chặn
nếu không có số liệu độ cao ở phần ngoài. Trong việc nội suy, kết quả sẽ tốt nếu
có được đầy đủ các điểm lân cận xung quanh điểm khống chế. Trong trương hợp
thiếu thì thuật toán sẽ làm cho kết quả bị lệch xiên đi so với đường biên và như
vậy phần lớn kết quả ở vùng biên sẽ không chính xác. Trong trường hợp tính toán
độ dốc, hướng dốc, độ cao … đều gặp lỗi ở phần biên.
Để khắc phục tình trạng đó, giải pháp tốt nhất là lựu chọn vùng nghiên cứu
nhỏ hơn và nằm gọn trong vùng được nội suy. Thông thường vùng được nội suy
phải có diện tích lớn hơn vùng nghiên cứu khoảng 10%. Để thực hiện điều đó, sau
khi nội suy ta phải cắt bớt vùng nội suy một cách chính xác để có được đúng kết
quả nội suy cho vùng nghiên cứu
Cắt lớp bề mặt thống kê (Slicing Statistical Surface)
Phương pháp phổ biến để thực hiện bề mặt là tạo đường đồng mức giá trị độ
cao. Các khoảng cao đều giữ các đường đồng mức cho khả năng hình dung được
hình dạng của bề mặt. Tuy nhiên, cần lưu ý rằng khoảng giữa các đường đồnh
mức thì địa hình có sự thay đổi liên tục về giá trị độ cao. Vì khoảng cao đều được
lựa chọn phải thể hiện được tốt nhất diện mạo của địa hình. Đa số các phần mềm
HTTĐL cả Raster và Vector đều có khả năng chuyển đổi các đườngđồng mức
hoặc bề mặt đường đồng mức lên mặt phẳng nằm ngang nhằm thể hiện tính liên
tục của bề mặt địa hình. Kỹ thuật đó được gọi là kỹ thuật cắt lớp - giống như dùng
một con dao sắc cắt ngang bề mặt. Cắt lớp đơn giản là lựa chọn những khoảng cao
đều nhau để cho phép nhìn và phân biệt rõ các đặc điểm khác nhau của bề mặt –
nghĩa là có thể lựa chọn khoảng cách thẳng đứng giữa các đường đồng mức là lớn
nhất song không làm mất đi những hình dạng chính cả địa hình. Cắt lớp giúp có
được hình ảnh chung của mặt phẳng hướng mà không cần xử lý tạo bề mặt hướng.
Thông thường, để nhìn chi tiết các đặc điểm trên bề mặt, ta phải lựa chọn khoảng
cao đều giữa các đường nhỏ đi. Tất nhiên công việc đó chỉ có ý nghĩa thực tiễn
một khi số lượng mẫu điểm và phương pháp nội suy đã hoàn hảo.
Nói tóm lại thì bề mặt thống kê là kiểu bề mặt được xây dựng từ hệ thống
mẫu điểm và các giá trị mãu có thể rất đa dạng. Các giá trị mẫu đó được quy định
là giá trị z (độ cao) của các điểm. Từ các giá trị đó, các phương pháp nội suy cho
phép thành lập nên các bề mặt thống kêvà các bề mặt thống kê có thể là liên tục
hoặc tách biệt.
Có những phương pháp nội suy và việc áp dụng tuỳ thuộc vào tính chất của
hệ thống mẫu điểm Kriging là phương pháp nội suy có tính chất ưu việt nhất cho
phép tạo lập được bề mặt sát thực nhất.
Bề mặt thống kê và phương pháp nội suy cho phép tạo ra nhiều loại bản đồ
ứng dụng khác nhau như bản đồ các đường đồng mức, bản đồ độ dốc, hướng dốc,
hướng bóng… Với những thuật toán chung có ở trong phần mềm HTTĐL, song
việc ứng dụng là rất đa dạng trong nhiều lĩnh vực của địa học.