нубский вопрос про кодировки

программирование Linux MySQL

Нужно было сконвертировать файл excel в mysql базу данных.
получилось как то так: excel > csv > sql

Проблема заключается в том файл содержал французские слова и после конвертации в csv все символы типа 'ç' и 'é' превратились в '?'

я не могу понять следующий момент - там где указаны знаки вопроса это символ безвозвратно потерян или можно сменить кодировку и всё станет на свои места? Если да то какую поставить? Сейчас стоит latin1_swedish_ci

Linux тут при том что там обидают специалисты по всему)

Примечание:
>скорее всего французские буквы превратились в "?" потому что в настроиках ОС у вас нет поддержки этого языка.

тогда почему они видны при просмотре excel файла?

>Чтобы не терять нужно использовать кодировку таблиц базы UTF-8.

я бы с радостью, но во время экспорта меня не спрашивали кодировку

Примечание:
>1) В csv надо не конвертировать, а сохранять из самого Экселя
возможно я неправильно выразился. Но так я и сделал

>2) Если в csv всё отобразилось правильно
как раз таки проблема с csv

Примечание:
>"latin1_swedish_ci" - это-то откуда?

моя не знать. Я импортировал файл через консоль мускуля
load data infile 'file.csv' into table test fields terminated by ';' ENCLOSED BY '"' lines terminated by '\r\n';
Потом подключился через phpmyadmin и там уже было указанна такая кодировка, пробовал менять на юникод но ничего не изменилось.

Примечание:
Решилось таким образом:

1) нужно сконвертировать excel используя libre office и во время сохранения ставим галочку на "edit filter settings". С мс офисом такое не прокатит т.к. он сохраняет cvs только в ascii

2) заливаем файл на сервер

3) Через консоль мускуля создаём базу данных, таблицу и потом импортируем файл следующей командой:

load data infile '/home/file.csv' into table clients character set utf8 fields terminated by ',' ENCLOSED BY '"' lines terminated by '\n';

Примечание:
>Чтобы не терять нужно использовать кодировку таблиц базы UTF-8.

дело в том что пришлось мускуль носом ткнуть в utf8, иначе он отказывался нормально отображать файлы.

>Назовите ОСи, локализации их и Офиса

ужас, выяснилось что у меня на генте были все возможные локали

locale -a | wc -l
785
Ответы:
скорее всего французские буквы превратились в "?" потому что в настроиках ОС у вас нет поддержки этого языка.
там где указаны знаки вопроса это символ безвозвратно потерян
- Да.
Чтобы не терять нужно использовать кодировку таблиц базы UTF-8.
1) В csv надо не конвертировать, а сохранять из самого Экселя


11 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.