aboutsummaryrefslogtreecommitdiff
path: root/source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
diff options
context:
space:
mode:
authorAdrian Kummerlaender2018-09-24 10:01:42 +0200
committerAdrian Kummerlaender2018-09-24 10:01:42 +0200
commit218123bcc40a82ec10bf4f1de372f72557aa0064 (patch)
treecf376a1fa965e8eb70e2507e7472e6d5a74299a7 /source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
parentbf1c9fefa96804acb94be615757be3d5d019c1a2 (diff)
downloadblog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.tar
blog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.tar.gz
blog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.tar.bz2
blog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.tar.lz
blog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.tar.xz
blog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.tar.zst
blog.kummerlaender.eu-218123bcc40a82ec10bf4f1de372f72557aa0064.zip
Update code.kummerlaender.eu links
Diffstat (limited to 'source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md')
-rw-r--r--source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md2
1 files changed, 1 insertions, 1 deletions
diff --git a/source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md b/source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
index 0238df3..ef12969 100644
--- a/source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
+++ b/source/00_content/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
@@ -20,7 +20,7 @@ Wir müssen in diesem Fall also auf externe Bibliotheken wie beispielweise [icon
## Ein UTF-8 Codepoint-Iterator in C++
-Um zumindest für rein lesende Zugriffe auf UTF-8 Strings nicht gleich eine Bibliothek wie Boost oder [easl](http://code.google.com/p/easl/) verwenden zu müssen habe ich einen einfachen UTF-8 Codepoint-Iterator anhand der Spezifikation in [RFC3629](http://tools.ietf.org/html/rfc3629) implementiert. Den Quellcode dieser Klasse stelle ich auf [Github](https://github.com/KnairdA/CodepointIterator) oder in [cgit](http://code.kummerlaender.eu/CodepointIterator/tree/) als Open Source unter der MIT-Lizenz zur freien Verfügung.
+Um zumindest für rein lesende Zugriffe auf UTF-8 Strings nicht gleich eine Bibliothek wie Boost oder [easl](http://code.google.com/p/easl/) verwenden zu müssen habe ich einen einfachen UTF-8 Codepoint-Iterator anhand der Spezifikation in [RFC3629](http://tools.ietf.org/html/rfc3629) implementiert. Den Quellcode dieser Klasse stelle ich auf [Github](https://github.com/KnairdA/CodepointIterator) oder in [Gitea](http://code.kummerlaender.eu/adrian/CodepointIterator/) als Open Source unter der MIT-Lizenz zur freien Verfügung.
UTF-8 enkodiert die aktuell maximal 21 Bit eines Unicode Code-Points in bis zu vier Code-Units mit einer Länge von je einem Byte. Die verbleibenden
maximal 11 Bit werden dazu verwendet, Anfangs- und Fortsetzungs-Bytes eines Code-Points zu kennzeichnen und schon in der ersten Code-Unit zu definieren, in wie vielen Code-Units das aktuelle Symbol enkodiert ist.