Forum Webscript.Ru
Дизайн и Верстка => Всё о Html => Тема начата: Anticlone от 04 Августа 2006, 13:08:24
-
Господа аlepar и CGVictor! Господа доки и профессионалы!
Прежде всего позвольте мне выказать свое уважение к тому безупречному потенциалу знаний, которым вы обладаете, равно как и искреннюю благодарность за проявленную вами отзывчивость к практически возникшей у меня проблеме.
Я также хотел бы попросить нашего модератора не закрывать без надобности, или хотя бы раньше времени, открытую мной тему, которая оказалась для меня крайне полезной. Во-первых, в лице настоящего форума я приобрел очень ценных друзей-советников. Во-вторых, ... вопросы-то остались! Сам удивлен :)
После ваших подробных консультаций - а именно такие проливают свет для непрофессионалов как я (IT для меня, увы, такая же терра инкогнита, как и германистика или история средневековой Швеции, возможно, для кого-то из вас), становится возможным полноценное и главное базовое понимание сути возникающих проблем и задаваемых вопросов.
Из всего изложенного вами мне стало теперь абсолютно ясно, что можно было делать, а чего нельзя, сохраняя html-файлы в ANSI. Но, строгие законы техногенности продолжают ставить свои жесткие правила, неумолимо требуя их безотступного выполнения.
Оказалось, что и все обсуждавшееся нами в предыдущей теме в моем случае тоже не подойдет. Дело в том, что сайт, который я строю, в отдельных случаях все же многоязычен. На 90% он состоит из русского языка, но в нем присутствуют и текстовые сопровождения на английском, немецком и французском языках. В последних двух, как вы знаете, имеются такие символы как "умляуты" (буквы с двумя точками на верху) и специфические над ними же треугольнички и черточки из французского. ANSI отказывается сохранять в этих случаях html-файлы.
Ваши мнение, господа? Не является ли тогда самым лучшим в этой ситуации решением сохранять все файлы все же в UTF-8? И уже не прописывая, при этом, две известные строки
в html-файда?
С уважением,
-
если ты хочеш в UTF-8 даные хранить, а тебе это необходимо сделать, то прийдется и charset=windows-1251 заменить на charset=utf-8.
а не прописывать, это грубая ошибка, браузер у каждого клиента настроен по разному, а эта строка уточняет в каком коде браузер получил страницу.
-
ОК. Значит эти две строчки в любом случае надо прописывать: что в ANSI, что utf-8? Только в чем разница между "заменить" и "прописать"?
Я прописываю (сознательно) весь сайт в блокноте вручную. Я что же не смогу теперь так же вручную вписать туда (в ) эти самые две строчки:
? К стати, если так, то это правильно?
-
Anticlone
Хм... как скажешь.
Храни в UTF8 тогда, если у тебя действительно мультиязычность.
С языками и кодировками вопрос исчезает.
-
Понял. Save as будет в UTF-8. А упомянавшиеся две строки кодировки, в которых вместо charset=windows-1251, должно теперь быть charset=UTF-8 надо будет при этом вписывать в той же последовательности в файла?
Если да, то так - все правильно? Вписывать буду вручную, поэтому не хотелось бы упустить ни одну деталь.
-
Anticlone
Да, всй правильно.
-
Всем огромное спасибо! Если б в виртуале существовала бы призентация сайта (as happenings) как в реале, всех обязательно бы пригласил :)
-
[off]Anticlone
Дык есть вроде :) Публикуешь и приглашаешь :D[/off]
-
Теперь вопрос не практического значения, а так, скорее интереса ради. Как вы думаете, зачем в UTF-8 необходимо прописывать в эти две строки
с указанием в нем "charset=UTF-8", если он - UTF-8 - изначально и так уже был создан для верного отражения всевозможных символов и всех алфавитов, включая варианты кириллицы?
-
Anticlone
- text/html определяет, как браузер будет работать с содержимым. Это понятно.
- charset=UTF-8 служит для того, чтобы браузер применял к тексту не таблицу из локальных настроек, а именно UTF-8.
- content-language служит разным целям: во-первых, поисковикам; во-вторых, браузеру (при наличии rel=alternate lang=en-us он может предложить выбор языка, например); в-третьих, для некоторых текстовых служб (экранные читалки, например)
Короче, RTFM. Всё в спецификациях ясно и грамотно написано.
-
Выходит, как ни крути, несмотря на то, что html-файл и так уже сохранен в UTF-8 и при всем том, что он создан для любых алфавитов вместе взятыми, в charset необходимо снова указывать:
что он (то бишь charset сохранененного в UTF-8 файла) равен (=) опять таки именно UTF-8. Поразительная перестраховка! Но... ни мне судить. Раз надо, значит - надо.
-
Anticlone
Anticlone:
Поразительная перестраховка!
Понимаешь, в чем дело... по файлу просто так не определить, является ли он UTF8 или просто ASCII. А уж сходство с бинарником вообще почти полное. Поэтому поступают вполне логично: хочешь грамотного и гарантированного отображения - указывай явно.
-
Вот теперь АБСОЛЮТНО ясно!
Благодаря Вам, CGVictor, я почти добрался до фундаментальных основ. Согласитесь, ведь не словишь особого кайфа, когда прописываешь чисто механически всё по правилам (так мол - и точка. А почему - не важно...) Но, вот когда раскрываются глубинные основы основ... То что раньше казалось просто картинкой, теперь предстает почти живым организмом
Спасибо.
-
Anticlone
Always welcome.
-
Danke :)
-
А я совсем забыл спросить: как правильно всё же будет вписывать в charset=... UTF-8 или utf-8 ?
-
Anticlone
Согласно соглашению (http://www.iana.org/assignments/character-sets) IANA (http://www.iana.org/) от 08.01.2005 (based on ANSI_X3.4-1968) указания кодировок не отличаются в регистре.
UTF-8 (RFC3629) проходит в MIBenum как #106, псевдонимов написания не имеет.
Использовать в тексте принято заглавное написание.
Однако отмечу, что браузеры понимают, в дополнение к официальному написанию, следующие синонимы: unicode-utf_8, unicode-utf_8-1_1, unicode-1-1-utf-8, unicode-2-0-utf-8 (x-unicode-2-0-utf-8). Использовать не рекомендую, но встретить можно.
-
[OFF]Есть подозрение, что вам [c: грубо насилуют] мозг, а вы ведетесь. Очень забавно это все наблюдать… =)[/OFF]
-
hanslinger
[OFF]довольно, откровенно.[/OFF]
-
похабно
-
CGVictor, еще раз - спасибо.
-
[off]hanslinger
Да и пусть. Тема в правила форума попадает, для community тоже полезно будет почитать. Да и мне тоже, в памяти освежить. Так что пусть висит пока.[/off]
-
Позиция человека, бескорыстно помогающего советом другим вызывает только уважение.
А, вот что вызывают пахабные намеки из глубин подозрительной души... пусть каждый ответит сам.
-
[OFF]
Никаких «пахабных» намеков.
Я на прошлой работе так «помогал» одному гражданину. Только ни один из моментов моей помощи никакой пользы не принес. Гражданин тот занимается программированием уже 20 лет, писал методички по SQL, но не знает, где (а главное — как) найти документацию по MySQL и PHP, хотя работает «веб-программистом».
Это я к тому, что лучшая помощь — «помоги себе сам».
CGVictor
Ну что за цензура, как дети малые…
[/OFF]