Semua data karakter dalam SQL Server dikaitkan dengan pemeriksaan, yang menentukan domain karakter yang dapat disimpan serta aturan yang digunakan untuk membandingkan dan mengurutkan data. Collation berlaku untuk data Unicode dan Non-Unicode.
SQL Server mencakup 3 kategori besar kumpulan: biner, lawas, dan Windows. Koleksi dalam kategori biner ( _BIN
akhiran) menggunakan poin kode yang mendasarinya untuk membandingkan sehingga perbandingan kesetaraan mengembalikan tidak sama jika poin kode berbeda terlepas dari karakter. Koleksi lawas ( SQL_
awalan) dan Windows menyediakan penyortiran dan perbandingan semantik untuk aturan kamus yang lebih alami. Ini memungkinkan perbandingan untuk mempertimbangkan case, aksen, lebar, dan Kana. Windows collations menyediakan word-sort
aturan yang lebih kuat yang erat selaras dengan OS Windows sedangkan collacy legacy hanya mempertimbangkan karakter tunggal.
Contoh di bawah ini mengilustrasikan perbedaan antara Windows dan pengumpulan biner dengan karakter Teth:
CREATE TABLE dbo.WindowsColationExample
(
Character1 nchar(1) COLLATE Arabic_100_CI_AS_SC
, Character2 nchar(1) COLLATE Arabic_100_CI_AS_SC
, Character3 nchar(1) COLLATE Arabic_100_CI_AS_SC
, Character4 nchar(1) COLLATE Arabic_100_CI_AS_SC
);
CREATE TABLE dbo.BinaryColationExample
(
Character1 nchar(1) COLLATE Arabic_100_BIN
, Character2 nchar(1) COLLATE Arabic_100_BIN
, Character3 nchar(1) COLLATE Arabic_100_BIN
, Character4 nchar(1) COLLATE Arabic_100_BIN
);
INSERT INTO dbo.BinaryColationExample
VALUES ( NCHAR(65217), NCHAR(65218), NCHAR(65219), NCHAR(65220) );
INSERT INTO dbo.WindowsColationExample
VALUES ( NCHAR(65217), NCHAR(65218), NCHAR(65219), NCHAR(65220) );
--all characters compare not equal
SELECT *
FROM dbo.BinaryColationExample
WHERE
character1 = character2
OR character1 = character3
OR character1 = character4
OR character2 = character3
OR character2 = character4
OR character3 = character4;
--all characters compare equal
SELECT *
FROM dbo.WindowsColationExample
WHERE character1 = character2;
SELECT *
FROM dbo.WindowsColationExample
WHERE character1 = character3;
SELECT *
FROM dbo.WindowsColationExample
WHERE character1 = character4;
SELECT *
FROM dbo.WindowsColationExample
WHERE character2 = character3;
SELECT *
FROM dbo.WindowsColationExample
WHERE character2 = character4;
SELECT *
FROM dbo.WindowsColationExample
WHERE character3 = character4;
Alasan mengapa Unicode dapat berisi titik kode yang berbeda untuk mesin terbang yang identik diuraikan di http://en.wikipedia.org/wiki/Duplicate_characters_in_Unicode . Saya ringkas, itu mungkin untuk kompatibilitas warisan atau karakter tidak setara dengan kanonik. Perhatikan bahwa karakter Teth ﻁ
digunakan dalam berbagai bahasa ( http://en.wikipedia.org/wiki/Teth ).