UNICODE
The difference between UTF-8 and Unicode?
UTF-8 and Unicode cannot be compared. UTF-8 is an encoding used to translate binary data into numbers. Unicode is a character set used to translate numbers into characters.
Vill du se exempel på vilka tecken som finns stöd för i Unicode? Gå till sidan om specialtecken
Citat
UTF-8 is an encoding
Unicode is a character set
Förkortningar
- UTF - Unicode Transformation Format
- UCA - Unicode Collation Algorithm
- BOM - Byte order mark
- PUA - Private Use Area
- BMP - Basic Multilingual Plane (0x000 - 0xFFFF)
- CS - Case sensitive
- CI - Case insensitive
Webbplats
Unicode.orgAntal tecken
UTF-7 | 127 |
UTF-8 | 255 |
UTF-16 | 65,535 |
UTF-32 | 2,147,483,647 |
Avkoda domän till unicode med PHP
idn_to_utf8('xn--skmotorn-n4a.se'); # sökmotorn.se
Liknande
Kända personer
- Kenneth Lane "Ken" Thompson
- Rob Pike
- Ken Thompson
Företag
- uni3
- Apple
- Microsoft
- Fujitsu
- Panasonic
- Sharp
- SUN
- XEROX
- HUAWEI
- ORACLE
- SAP
- IBM
- Netflix
Kolla teckenkodning med UNIX
file -I file.txt
Använd unicode i vim
:set fileencodings=utf-8
:set encoding=utf-8
Meta-tagg för HTML5
<meta charset="utf-8">
Meta-tagg för HTML
<meta http-equiv="Content-type" content="text/html; charset=utf-8">
CSS
unicode-range
Teckenuppsättning i Javascript
document.characterSet
htaccess
AddDefaultCharset UTF-8
Flagga i regex i PHP
- u (
PCRE_UTF8
) - Denna modifierare slår på fler funktioner av PCRE som är inkompatibla med Perl. Mönster- och ämnes-strängar behandlas nu som UTF-8. Ett ogiltigt ämne kommer leda till att funktionen
preg_*
inte matchar någonting; ett ogiltigt mönster kommer trigga ett fel av nivåE_WARNING
. Fem och sex okteter UTF-8 sekvenser avses som ogiltiga sedan PHP5.3.4
(respektive PCRE7.3
); tidigare har dessa varit giltiga i UTF-8.
Sätt header med PHP
header('Content-Type: text/html; charset=utf-8');
Konvertera om med PHP
iconv('ISO-8859-1', 'UTF-8', $text)
Koda med PHP
utf8_encode();
Avkoda med PHP
utf8_decode();
PHP
utf8_encode();
mb_internal_encoding('utf-8');
mb_strtolower($str, 'UTF-8');
Lägg till BOM (0xEF 0xBB 0xBF
) för en fil med PHP
$utf8_with_bom = chr(239) . chr(187) . chr(191) . $utf8_string;
Kollationering
- utf8_bin
- utf8_czech_ci
- utf8_danish_ci
- utf8_esperanto_ci
- utf8_estonian_ci
- utf8_general_ci
- utf8_hungarian_ci
- utf8_icelandic_ci
- utf8_latvian_ci
- utf8_lithuanian_ci
- utf8_persian_ci
- utf8_polish_ci
- utf8_roman_ci
- utf8_romanian_ci
- utf8_slovak_ci
- utf8_slovenian_ci
- utf8_spanish2_ci
- utf8_spanish_ci
- utf8_swedish_ci
- utf8_turkish_ci
- utf8_unicode_ci
Exempel på sortering utf8mb4_swedish_ci
- Å
- å
- Ä
- Æ
- ä
- æ
- Ö
- Ø
- ö
- ø
Exempel på sortering utf8mb4_unicode_520_ci
- Å
- Ä
- å
- ä
- Æ
- æ
- Ö
- Ø
- ö
- ø
Innehåller
Länkar
Externa länkar
- http://unicode.org/
- http://unicode.org/charts/
- http://www.2ality.com/2013/09/javascript-unicode.html?m=1
- http://javascript.about.com/library/blunicode.htm
- http://www.evotech.net/articles/testjsentities.html
- http://emojipedia.org/unicode-7.0/
- Unicode-table.com