1// -*- C++ -*- 2/* Copyright (C) 2002, 2003, 2004 3 Free Software Foundation, Inc. 4 Written by Werner Lemberg <wl@gnu.org> 5 6This file is part of groff. 7 8groff is free software; you can redistribute it and/or modify it under 9the terms of the GNU General Public License as published by the Free 10Software Foundation; either version 2, or (at your option) any later 11version. 12 13groff is distributed in the hope that it will be useful, but WITHOUT ANY 14WARRANTY; without even the implied warranty of MERCHANTABILITY or 15FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License 16for more details. 17 18You should have received a copy of the GNU General Public License along 19with groff; see the file COPYING. If not, write to the Free Software 20Foundation, 51 Franklin St - Fifth Floor, Boston, MA 02110-1301, USA. */ 21 22#include "lib.h" 23#include "stringclass.h" 24#include "ptable.h" 25 26#include "unicode.h" 27 28struct glyph_to_unicode { 29 char *value; 30}; 31 32declare_ptable(glyph_to_unicode) 33implement_ptable(glyph_to_unicode) 34 35PTABLE(glyph_to_unicode) glyph_to_unicode_table; 36 37struct S { 38 const char *key; 39 const char *value; 40} glyph_to_unicode_list[] = { 41 { "!", "0021" }, 42 { "\"", "0022" }, 43 { "dq", "0022" }, 44 { "#", "0023" }, 45 { "sh", "0023" }, 46 { "$", "0024" }, 47 { "Do", "0024" }, 48 { "%", "0025" }, 49 { "&", "0026" }, 50 { "aq", "0027" }, 51 { "(", "0028" }, 52 { ")", "0029" }, 53 { "*", "002A" }, 54 { "+", "002B" }, 55 { "pl", "002B" }, 56 { ",", "002C" }, 57 { ".", "002E" }, 58 { "/", "002F" }, 59 { "sl", "002F" }, 60 { "0", "0030" }, 61 { "1", "0031" }, 62 { "2", "0032" }, 63 { "3", "0033" }, 64 { "4", "0034" }, 65 { "5", "0035" }, 66 { "6", "0036" }, 67 { "7", "0037" }, 68 { "8", "0038" }, 69 { "9", "0039" }, 70 { ":", "003A" }, 71 { ";", "003B" }, 72 { "<", "003C" }, 73 { "=", "003D" }, 74 { "eq", "003D" }, 75 { ">", "003E" }, 76 { "?", "003F" }, 77 { "@", "0040" }, 78 { "at", "0040" }, 79 { "A", "0041" }, 80 { "B", "0042" }, 81 { "C", "0043" }, 82 { "D", "0044" }, 83 { "E", "0045" }, 84 { "F", "0046" }, 85 { "G", "0047" }, 86 { "H", "0048" }, 87 { "I", "0049" }, 88 { "J", "004A" }, 89 { "K", "004B" }, 90 { "L", "004C" }, 91 { "M", "004D" }, 92 { "N", "004E" }, 93 { "O", "004F" }, 94 { "P", "0050" }, 95 { "Q", "0051" }, 96 { "R", "0052" }, 97 { "S", "0053" }, 98 { "T", "0054" }, 99 { "U", "0055" }, 100 { "V", "0056" }, 101 { "W", "0057" }, 102 { "X", "0058" }, 103 { "Y", "0059" }, 104 { "Z", "005A" }, 105//{ "[", "005B" }, 106 { "lB", "005B" }, 107//{ "\\", "005C" }, 108 { "rs", "005C" }, 109//{ "]", "005D" }, 110 { "rB", "005D" }, 111 { "a^", "005E" }, 112 { "^", "005E" }, 113 { "ha", "005E" }, 114 { "_", "005F" }, 115 { "ru", "005F" }, 116 { "ul", "005F" }, 117//{ "\\`", "0060" }, 118 { "ga", "0060" }, 119 { "a", "0061" }, 120 { "b", "0062" }, 121 { "c", "0063" }, 122 { "d", "0064" }, 123 { "e", "0065" }, 124 { "f", "0066" }, 125 { "ff", "0066_0066" }, 126 { "Fi", "0066_0066_0069" }, 127 { "Fl", "0066_0066_006C" }, 128 { "fi", "0066_0069" }, 129 { "fl", "0066_006C" }, 130 { "g", "0067" }, 131 { "h", "0068" }, 132 { "i", "0069" }, 133 { "j", "006A" }, 134 { "k", "006B" }, 135 { "l", "006C" }, 136 { "m", "006D" }, 137 { "n", "006E" }, 138 { "o", "006F" }, 139 { "p", "0070" }, 140 { "q", "0071" }, 141 { "r", "0072" }, 142 { "s", "0073" }, 143 { "t", "0074" }, 144 { "u", "0075" }, 145 { "v", "0076" }, 146 { "w", "0077" }, 147 { "x", "0078" }, 148 { "y", "0079" }, 149 { "z", "007A" }, 150 { "lC", "007B" }, 151 { "{", "007B" }, 152 { "ba", "007C" }, 153 { "or", "007C" }, 154 { "|", "007C" }, 155 { "rC", "007D" }, 156 { "}", "007D" }, 157 { "a~", "007E" }, 158 { "~", "007E" }, 159 { "ti", "007E" }, 160 { "r!", "00A1" }, 161 { "ct", "00A2" }, 162 { "Po", "00A3" }, 163 { "Cs", "00A4" }, 164 { "Ye", "00A5" }, 165 { "bb", "00A6" }, 166 { "sc", "00A7" }, 167 { "ad", "00A8" }, 168 { "co", "00A9" }, 169 { "Of", "00AA" }, 170 { "Fo", "00AB" }, 171 { "no", "00AC" }, 172 { "tno", "00AC" }, 173 { "shc", "00AD" }, 174 { "rg", "00AE" }, 175 { "a-", "00AF" }, 176 { "de", "00B0" }, 177 { "+-", "00B1" }, 178 { "t+-", "00B1" }, 179 { "S2", "00B2" }, 180 { "S3", "00B3" }, 181 { "aa", "00B4" }, 182//{ "\\'", "00B4" }, 183 { "mc", "00B5" }, 184 { "ps", "00B6" }, 185 { "pc", "00B7" }, 186 { "ac", "00B8" }, 187 { "S1", "00B9" }, 188 { "Om", "00BA" }, 189 { "Fc", "00BB" }, 190 { "14", "00BC" }, 191 { "12", "00BD" }, 192 { "34", "00BE" }, 193 { "r?", "00BF" }, 194 { "`A", "00C0" }, 195 { "'A", "00C1" }, 196 { "^A", "00C2" }, 197 { "~A", "00C3" }, 198 { ":A", "00C4" }, 199 { "oA", "00C5" }, 200 { "AE", "00C6" }, 201 { ",C", "00C7" }, 202 { "`E", "00C8" }, 203 { "'E", "00C9" }, 204 { "^E", "00CA" }, 205 { ":E", "00CB" }, 206 { "`I", "00CC" }, 207 { "'I", "00CD" }, 208 { "^I", "00CE" }, 209 { ":I", "00CF" }, 210 { "-D", "00D0" }, 211 { "~N", "00D1" }, 212 { "`O", "00D2" }, 213 { "'O", "00D3" }, 214 { "^O", "00D4" }, 215 { "~O", "00D5" }, 216 { ":O", "00D6" }, 217 { "mu", "00D7" }, 218 { "tmu", "00D7" }, 219 { "/O", "00D8" }, 220 { "`U", "00D9" }, 221 { "'U", "00DA" }, 222 { "^U", "00DB" }, 223 { ":U", "00DC" }, 224 { "'Y", "00DD" }, 225 { "TP", "00DE" }, 226 { "ss", "00DF" }, 227 { "`a", "00E0" }, 228 { "'a", "00E1" }, 229 { "^a", "00E2" }, 230 { "~a", "00E3" }, 231 { ":a", "00E4" }, 232 { "oa", "00E5" }, 233 { "ae", "00E6" }, 234 { ",c", "00E7" }, 235 { "`e", "00E8" }, 236 { "'e", "00E9" }, 237 { "^e", "00EA" }, 238 { ":e", "00EB" }, 239 { "`i", "00EC" }, 240 { "'i", "00ED" }, 241 { "^i", "00EE" }, 242 { ":i", "00EF" }, 243 { "Sd", "00F0" }, 244 { "~n", "00F1" }, 245 { "`o", "00F2" }, 246 { "'o", "00F3" }, 247 { "^o", "00F4" }, 248 { "~o", "00F5" }, 249 { ":o", "00F6" }, 250 { "di", "00F7" }, 251 { "tdi", "00F7" }, 252 { "/o", "00F8" }, 253 { "`u", "00F9" }, 254 { "'u", "00FA" }, 255 { "^u", "00FB" }, 256 { ":u", "00FC" }, 257 { "'y", "00FD" }, 258 { "Tp", "00FE" }, 259 { ":y", "00FF" }, 260 { "'C", "0106" }, 261 { "'c", "0107" }, 262 { ".i", "0131" }, 263 { "IJ", "0132" }, 264 { "ij", "0133" }, 265 { "/L", "0141" }, 266 { "/l", "0142" }, 267 { "OE", "0152" }, 268 { "oe", "0153" }, 269 { "vS", "0160" }, 270 { "vs", "0161" }, 271 { ":Y", "0178" }, 272 { "vZ", "017D" }, 273 { "vz", "017E" }, 274 { "Fn", "0192" }, 275 { "ah", "02C7" }, 276 { "ab", "02D8" }, 277 { "a.", "02D9" }, 278 { "ao", "02DA" }, 279 { "ho", "02DB" }, 280 { "a\"", "02DD" }, 281 { "*A", "0391" }, 282 { "*B", "0392" }, 283 { "*G", "0393" }, 284 { "*D", "0394" }, 285 { "*E", "0395" }, 286 { "*Z", "0396" }, 287 { "*Y", "0397" }, 288 { "*H", "0398" }, 289 { "*I", "0399" }, 290 { "*K", "039A" }, 291 { "*L", "039B" }, 292 { "*M", "039C" }, 293 { "*N", "039D" }, 294 { "*C", "039E" }, 295 { "*O", "039F" }, 296 { "*P", "03A0" }, 297 { "*R", "03A1" }, 298 { "*S", "03A3" }, 299 { "*T", "03A4" }, 300 { "*U", "03A5" }, 301 { "*F", "03A6" }, 302 { "*X", "03A7" }, 303 { "*Q", "03A8" }, 304 { "*W", "03A9" }, 305 { "*a", "03B1" }, 306 { "*b", "03B2" }, 307 { "*g", "03B3" }, 308 { "*d", "03B4" }, 309 { "*e", "03B5" }, 310 { "*z", "03B6" }, 311 { "*y", "03B7" }, 312 { "*h", "03B8" }, 313 { "*i", "03B9" }, 314 { "*k", "03BA" }, 315 { "*l", "03BB" }, 316 { "*m", "03BC" }, 317 { "*n", "03BD" }, 318 { "*c", "03BE" }, 319 { "*o", "03BF" }, 320 { "*p", "03C0" }, 321 { "*r", "03C1" }, 322 { "ts", "03C2" }, 323 { "*s", "03C3" }, 324 { "*t", "03C4" }, 325 { "*u", "03C5" }, 326 { "*f", "03C6" }, 327 { "*x", "03C7" }, 328 { "*q", "03C8" }, 329 { "*w", "03C9" }, 330 { "+h", "03D1" }, 331 { "+f", "03D5" }, 332 { "+p", "03D6" }, 333 { "+e", "03F5" }, 334 { "-", "2010" }, 335 { "hy", "2010" }, 336 { "en", "2013" }, 337 { "em", "2014" }, 338 { "`", "2018" }, 339 { "oq", "2018" }, 340 { "'", "2019" }, 341 { "cq", "2019" }, 342 { "bq", "201A" }, 343 { "lq", "201C" }, 344 { "rq", "201D" }, 345 { "Bq", "201E" }, 346 { "dg", "2020" }, 347 { "dd", "2021" }, 348 { "bu", "2022" }, 349 { "%0", "2030" }, 350 { "fm", "2032" }, 351 { "sd", "2033" }, 352 { "fo", "2039" }, 353 { "fc", "203A" }, 354 { "rn", "203E" }, 355 { "f/", "2044" }, 356 { "eu", "20AC" }, 357 { "Eu", "20AC" }, 358 { "-h", "210F" }, 359 { "hbar", "210F" }, 360 { "Im", "2111" }, 361 { "wp", "2118" }, 362 { "Re", "211C" }, 363 { "tm", "2122" }, 364 { "Ah", "2135" }, 365 { "18", "215B" }, 366 { "38", "215C" }, 367 { "58", "215D" }, 368 { "78", "215E" }, 369 { "<-", "2190" }, 370 { "ua", "2191" }, 371 { "->", "2192" }, 372 { "da", "2193" }, 373 { "<>", "2194" }, 374 { "va", "2195" }, 375 { "CR", "21B5" }, 376 { "lA", "21D0" }, 377 { "uA", "21D1" }, 378 { "rA", "21D2" }, 379 { "dA", "21D3" }, 380 { "hA", "21D4" }, 381 { "vA", "21D5" }, 382 { "fa", "2200" }, 383 { "pd", "2202" }, 384 { "te", "2203" }, 385 { "es", "2205" }, 386 { "gr", "2207" }, 387 { "mo", "2208" }, 388 { "nm", "2209" }, 389 { "st", "220B" }, 390 { "product", "220F" }, 391 { "coproduct", "2210" }, 392 { "sum", "2211" }, 393//{ "\\-", "2212" }, 394 { "mi", "2212" }, 395 { "-+", "2213" }, 396 { "**", "2217" }, 397 { "sr", "221A" }, 398 { "pt", "221D" }, 399 { "if", "221E" }, 400 { "/_", "2220" }, 401 { "AN", "2227" }, 402 { "OR", "2228" }, 403 { "ca", "2229" }, 404 { "cu", "222A" }, 405 { "is", "222B" }, 406 { "integral", "222B" }, 407 { "tf", "2234" }, 408 { "3d", "2234" }, 409 { "ap", "223C" }, 410 { "|=", "2243" }, 411 { "=~", "2245" }, 412 { "~~", "2248" }, 413 { "~=", "2248" }, 414 { "!=", "2260" }, 415 { "==", "2261" }, 416 { "ne", "2262" }, 417 { "<=", "2264" }, 418 { ">=", "2265" }, 419 { ">>", "226A" }, 420 { "<<", "226B" }, 421 { "sb", "2282" }, 422 { "sp", "2283" }, 423 { "nb", "2284" }, 424 { "nc", "2285" }, 425 { "ib", "2286" }, 426 { "ip", "2287" }, 427 { "c+", "2295" }, 428 { "c*", "2297" }, 429 { "pp", "22A5" }, 430 { "md", "22C5" }, 431 { "lc", "2308" }, 432 { "rc", "2309" }, 433 { "lf", "230A" }, 434 { "rf", "230B" }, 435 { "parenlefttp", "239B" }, 436 { "parenleftex", "239C" }, 437 { "parenleftbt", "239D" }, 438 { "parenrighttp", "239E" }, 439 { "parenrightex", "239F" }, 440 { "parenrightbt", "23A0" }, 441 { "bracketlefttp", "23A1" }, 442 { "bracketleftex", "23A2" }, 443 { "bracketleftbt", "23A3" }, 444 { "bracketrighttp", "23A4" }, 445 { "bracketrightex", "23A5" }, 446 { "bracketrightbt", "23A6" }, 447 { "lt", "23A7" }, 448 { "bracelefttp", "23A7" }, 449 { "lk", "23A8" }, 450 { "braceleftmid", "23A8" }, 451 { "lb", "23A9" }, 452 { "braceleftbt", "23A9" }, 453 { "bv", "23AA" }, 454 { "braceex", "23AA" }, 455 { "braceleftex", "23AA" }, 456 { "bracerightex", "23AA" }, 457 { "rt", "23AB" }, 458 { "bracerighttp", "23AB" }, 459 { "rk", "23AC" }, 460 { "bracerightmid", "23AC" }, 461 { "rb", "23AD" }, 462 { "bracerightbt", "23AD" }, 463 { "an", "23AF" }, 464 { "br", "2502" }, 465 { "rk", "251D" }, 466 { "lk", "2525" }, 467 { "lt", "256D" }, 468 { "rt", "256E" }, 469 { "rb", "256F" }, 470 { "lb", "2570" }, 471 { "sq", "25A1" }, 472 { "lz", "25CA" }, 473 { "ci", "25CB" }, 474 { "lh", "261C" }, 475 { "rh", "261E" }, 476 { "SP", "2660" }, 477 { "CL", "2663" }, 478 { "HE", "2665" }, 479 { "DI", "2666" }, 480 { "OK", "2713" }, 481 { "la", "27E8" }, 482 { "ra", "27E9" }, 483}; 484 485// global constructor 486static struct glyph_to_unicode_init { 487 glyph_to_unicode_init(); 488} _glyph_to_unicode_init; 489 490glyph_to_unicode_init::glyph_to_unicode_init() { 491 for (unsigned int i = 0; 492 i < sizeof(glyph_to_unicode_list)/sizeof(glyph_to_unicode_list[0]); 493 i++) { 494 glyph_to_unicode *gtu = new glyph_to_unicode[1]; 495 gtu->value = (char *)glyph_to_unicode_list[i].value; 496 glyph_to_unicode_table.define(glyph_to_unicode_list[i].key, gtu); 497 } 498} 499 500const char *glyph_name_to_unicode(const char *s) 501{ 502 glyph_to_unicode *result = glyph_to_unicode_table.lookup(s); 503 return result ? result->value : 0; 504} 505