UTF-8-------------------- < Пред. | След. > -- < @ > -- < Сообщ. > -- < Эхи > --
 Nп/п : 8 из 100
 От   : Rob Swindell                        1:103/705         05 мар 23 11:40:06
 К    : Michiel van der Vlist                                 05 мар 23 22:45:10
 Тема : codepage
----------------------------------------------------------------------------------
                                                                                 
@MSGID: 331.fidoutf8@1:103/705 286a2761
@REPLY: 2:280/5555 6404929a
@TZUTC: -0800
@PID: Synchronet 3.20a-Linux master/5d1d586fd Mar 3
2023 GCC 12.2.0
@TID: SBBSecho 3.20-Linux master/c02f2513f Mar 4
2023 GCC 12.2.0
@COLS: 80
@BBSID: VERT
@CHRS: CP437 2
@NOTE: FSEditor.js v1.104
  Re: codepage
  By: Michiel van der Vlist to Rob Swindell on Sun Mar 05 2023 02:01 pm

 > Hello Rob,
 >
 > On Saturday March 04 2023 13:11, you wrote to me:
 >
 >  >> So let me get this straight:
 >  >>
 >  >> 1) If the message that is responded to, is encoded in CP437,
 >  >> Synchronet answers in CP437. Yes?
 >
 >  RS> No. The message response itself determines the encoding and only CP437
 >  RS> terminals can faithfully author CP437 encoded messages. If a UTF-8
 >  RS> terminal user responds to a CP437 encoded message (with non-ASCII
 >  RS> chars), the original message text is converted to UTF-8 before it is
 >  RS> quoted and the response will be UTF-8. Unless there are no non-ASCII
 >  RS> chars in the response, in which case the response charset witll just
 >  RS> be ASCII.
 >
 > I see... So it is the terminal - or whatever functions as its equivalent -
 > and only the terminal that determines the encoding of the message at hand.

 Or rather, the message content created with that terminal. If the
content is just plain ASCII, regardless of the terminal that created it,
then the message will fly the ASCII charset flag. In Synchronet, a CP437
terminal cannot be used to created UTF-8 content, so messages created by
such a terminal will either be ASCII or CP437 encoded.

 > It is making assumtions, but they are not false I would say. Read on.. I
 > will come back to that further down.
 >
 >  >> What happens if the original message is encoded in a one byte
 >  >> encoding other than CP437?
 >
 >  RS> The only encodings Synchronet supports for message text are ASCII,
 >  RS> CP437, and UTF-8.
 >
 > Hmmm... That leaves out a big part of Fidonet. These days the majority,
 > maybe the vast majority is writen in a language that uses the Cyrillic
 > alfabet and the encoding is CP866.

True, that`s the state of things.

 >  >> 2) If the message that is responded to is encoded in UTF-8,
 >  >> Synchronet answers in UTF-8 if the terminal that is used supports
 >  >> UTF-8. Yes?
 >
 >  RS> Yes.
 >
 > OK, so far so good...
 >
 >  >> So what happens in that case if the terminal does not support
 >  >> UTF-8?
 >
 >  RS> The message text would be converted to CP437 before being quoted and
 >  RS> the response would be in CP437.
 >
 > And now I come back to my previous question: what happens if it does not fit
 > into CP437? That can easely happen. A Euro sign `и` can be composed in UTF-8
 > but it  does not fit into CP437.

 When a CP437 terminal user quotes a UTF-8 message that contains
untranslatable UNICODE codepoints without a CP437 equivalent, they`re translated to
character that indiciates it was untranslatable. By default, that character is
the upside down question mark.
-- 
                                            digital man (rob)

Sling Blade quote #14:
Karl Childers: Some folks call it a sling blade, I call it a kaiser blade.
Norco, CA WX: 51.1°F, 73.0% humidity, 4 mph E wind, 0.00 inches rain/24hrs
--- SBBSecho 3.20-Linux
 * Origin: Vertrauen - [vert/cvs/bbs].synchro.net (1:103/705)
SEEN-BY: 10/0 1 50/109 103/705 106/201 114/705
123/120 124/5016 153/757 7715
SEEN-BY: 154/10 203/0 218/0 1 700 840 860 220/70
221/0 1 6 242 360 226/17 30
SEEN-BY: 227/114 229/111 112 113 307 317 426 428
470 700 230/0 240/1120 5832
SEEN-BY: 250/5 8 267/800 280/464 5003 5555 292/854
8125 298/25 301/1 305/3
SEEN-BY: 310/31 317/3 320/219 335/364 341/66 234
423/81 120 460/58 467/888
SEEN-BY: 712/848 770/1 100 340 772/210 220 230
4500/1 5001/100 5005/49
SEEN-BY: 5015/46 5020/715 736 830 848 1042 4441
12000 5030/49 1081 1474
SEEN-BY: 5054/8 5058/104 5064/56
@PATH: 103/705 218/700 229/426 317/3 770/1 280/464
221/1 6 5020/1042 4441



   GoldED+ VK   │                                                 │   09:55:30    
                                                                                
В этой области больше нет сообщений.

Остаться здесь
Перейти к списку сообщений
Перейти к списку эх