Перейти к содержимому

Какой символ разделяет данные в файле формата csv

  • автор:

Как csv разделить по столбцам, за минуту

Настройка серверов windows и linux

Добрый день! Уважаемые читатели и гости одного из крупнейших IT блогов для системных администраторов Pyatilistnik.org. В прошлый раз мы с вами подробно разобрали 10 методов как открыть командную строку. В сегодняшней публикации я хочу вас научить разбивать строки в CSV файле на столбцы, которые потом можно использовать в файлах Excel. Уверен, что многие системные администраторы часто работаю с экспортными данными в формате CSV.

Постановка задачи

Бьюсь об заклад, что у 99% средних и крупных организаций в России инфраструктура построена на использовании Active Directory. Активный каталог замечательная вещь и легко интегрируется в различные сторонние сервисы. Самая частая задача администратора, это получение отчетов или выгрузок по определенным критериям, например:

  • Получить список пользователей Active Directory с рядом атрибутов
  • Получить список серверов у которых операционная система Windows Server 2008 R2, чтобы в дальнейшем их вывести из эксплуатации
  • Получить список всех компьютеров или пользователей, кто не авторизовывался какое-то время. И так до бесконечности

Получить данные вы можете в разном виде, например в виде выдачи на самом экране, или же в сохраненный файл в формате txt или csv. CSV более распространенный, так как позволяет не только выгружать данные, но и еще их импортировать. Вроде бы все удобно, но есть одно но, когда вы захотите красиво перенести такие данные из csv, txt или экрана, у вас не будет форматирования или столбцов, все будет смешано в кучу, а это не удобно. Ниже я вас научу это обходить.

Структура файла CSV

Файл с разделителями-запятыми (CSV) представляет собой простой текстовый файл, который содержит список данных. Эти файлы часто используются для обмена данными между различными приложениями. Например, базы данных и менеджеры контактов часто поддерживают файлы CSV.

Эти файлы иногда могут называться символьно-разделенными значениями или файлами с разделителями-запятыми. В основном они используют запятую для разделения данных, но иногда используют другие символы, такие как точки с запятой. Идея состоит в том, что вы можете экспортировать сложные данные из одного приложения в файл CSV, а затем импортировать данные из этого файла CSV в другое приложение.

Вот пример такого строки с разделителями:

«Name»,»OperatingSystem»,»LastLogonDate»,»Modified»,»Enabled» ,»Ping»,»DistinguishedName»
«DC01″,»Windows Server 2008 R2 Standard»,»02.11.2018 6:14:02″, «21.12.2018 15:56:16″,»Torge»,»False»,»CN=DC01, OU=ComputerStore,OU=root,DC=pyatilistnik,DC=org»

Структура файла CSV

теперь представьте, что таких строк сотни или тысячи, а вы хотите все скопировать в ваш Exсel и по столбцам, вот тут вы и поймете, что одностроковый формат требует преобразования. Благо, это делается очень быстро и просто. Вот пример моего тестового csv файла.

Как csv разделить по столбцам в Excel

Первым инструментом, который позволит из csv получить красивые столбцы и разбиение по ним, будет Excel. Откройте в Excel ваш файл csv.

  • Выделите первый столбец и перейдите на вкладку «Данные«
  • Найдите пункт «Текст по столбцам«

Как csv разделить +по столбцам в Excel

На первом окне мастера распределения текста по столбцам нажмите «Далее».

Как csv разделить по столбцам

Далее вам необходимо указать по каким критериям производить разбивку по столбцам, на выбор у вас будет:

  • Знак табуляции
  • Точка с запятой
  • Запятая
  • Пробел
  • Другой вариант

В моем примере CSV разделяет отдельные данные с помощью запятой. Тут же вы сразу видите, как это будет выглядеть в области «Образец разбора данных«.

Разделение CSV данных с запятой на столбцы

Далее при необходимости вы можете указать формат (Общий, текстовый, дата) и диапазон к которому будет применяться ваше преобразование. Нажимаем «Готово«.

Как csv разделить +по столбцам в Excel

На выходе я получил красивую таблицу, где есть разбивка по столбца. В таком виде мне уже удобнее оперировать данными.

Успешное разбиение csv данных по столбцам

Далее вам остается сохранить файл в формате xlsx и радуемся жизни.

Как csv разделить по столбцам через Google Таблицы

Не так давно я вам рассказывал про установку через групповую политику расширения для Google Chrome под названием «Редактирование файлов Office«. Это расширение позволяло работать с файлами Word, Excel и PowerPoint в Google Документах, Google Таблицах и Google Презентациях. Если вы через него откроете ваш файл CSV, то вы буквально в два клика сможете его разбить на столбцы. Для этого выберите меню «Файл — Сохранить в формате Google Таблиц«.

Как csv разделить по столбцам через Google Таблицы

Начнется переделывание формата CSV в формат Google Таблиц

переделывание формата CSV в формат Google Таблиц

На выходе вы получаете разделенный по столбцам документ.

разделенный по столбцам документ csv

Далее вы уже можете оперировать этими данными или же можете их сохранить в нужный формат. Если у вас изначально документ Google Таблиц содержит данные разделенные запятой в виде одной строки, то вы их можете преобразовать в столбцы вот таким методом. Открываете меню «Данные — Разделить текст на столбцы«

Как csv разделить по столбцам через Google Таблицы

Выбираете тип разделения, в моем случае запятая.

Выбор условия разьиения по столбцам в csv файле

Затем выбираете ваш столбец с данным и еще раз нажмите «Данные — Разделить текст на столбцы«

Как csv разделить по столбцам

В результате чего они будут разбиты на аккуратные столбцы

В результате чего они будут разбиты на аккуратные столбцы

Как видите Google Таблицы умеют быстро разбить файл CSV по столбцам. Надеюсь, что это вам сэкономит время и вы сможете теперь более удобно оперировать данными. С вами был Иван Семин, автор и создатель IT портала Pyatilistnik.org.

Популярные Похожие записи:
  • Как преобразовать GUID пользователя Active Directory в имя
  • Get-ADUser и примеры использованияGet-ADUser и примеры использования
  • Как сделать сводную таблицу, за минуту
  • Импорт таблицы на веб-странице в Google SheetsИмпорт таблицы на веб-странице в Google Sheets
  • Get-ADComputer: примеры вывода данных о компьютерах Active DirectoryGet-ADComputer: примеры вывода данных о компьютерах Active Directory
  • Как вывести список установленных программ в Windows 11Как вывести список установленных программ в Windows 11

Какой символ разделяет данные в файле формата csv

СSV (от англ. Values — значения, разделённые запятыми) — текстовый формат, предназначенный для представления табличных данных. Каждая строка файла — это одна строка таблицы. Значения отдельных колонок разделяются разделительным символом (delimiter) — запятой (,). Однако, большинство программ вольно трактует стандарт CSV и допускают использование иных символов в качестве разделителя. В частности в локалях, где десятичным разделителем является запятая, в качестве табличного разделителя, как правило, используется точка с запятой. Значения, содержащие зарезервированные символы (двойная кавычка, запятая, точка с запятой, новая строка) обрамляются двойными кавычками («); если в значении встречаются кавычки — они представляются в файле в виде двух кавычек подряд. Строки разделяются парой символов CR LF (0×0D 0×0A) (в DOS и Windows эта пара генерируется нажатием клавиши Enter). Однако конкретные реализации могут использовать другие общепринятые разделители строк, например LF (0×0A) в UNIX.

Несмотря на наличие RFC, на сегодняшний день под CSV, как правило, понимают набор значений, разделенных какими угодно разделителями, в какой угодно кодировке с какими угодно окончаниями строк. Это значительно затрудняет перенос данных из одних программ в другие, несмотря на всю простоту реализации поддержки CSV.

Пример CSV-файла

1997,Ford,E350,»ac, abs, moon»,3000.00
1999,Chevy,»Venture «»Extended Edition»»»,»»,4900.00
1996,Jeep,Grand Cherokee,»MUST SELL! air, moon roof, loaded»,4799.00

1997 Ford E350 ac, abs, moon 3000
1999 Chevy Venture «Extended Edition» 4900
1996 Jeep Grand Cherokee MUST SELL!
air, moon roof, loaded
4799

CSV — это формат файла, который поддерживается многими приложениями. .CSV файлы часто используются для импорта\экспорта табличных данных между двумя различными компьютерными программами, например, между базой данных и электронной таблицей.

При помощи чего открыть файл .csv?

  • Microsoft Excel
  • Microsoft Works
  • Corel WordPerfect Office X7
  • Apache OpenOffice
  • LibreOffice
  • Блокнот Windows
  • Intuit Quicken 2014
  • Любой текстовый редактор

Что такое файл значений, разделенных запятыми (файл CSV)?

Если вы подпишитесь на услугу по ссылке на этой странице, Reeves and Sons Limited может получить комиссию. Смотрите наши заявление об этике.

CSV-файл — это текстовый файл, содержащий некоторые данные. В обычных обстоятельствах файл CSV используется для передачи данных из одного приложения в другое. В качестве пояснения, файл CSV хранит данные, как числа, так и текст в виде простого текста. Как вы, возможно, знаете, обычный текст сжимаетformatион и позволяет текст formatтин. Обычно все поля разделяются запятыми, а все записи разделяются сложной строкой символов. В таблицах Excel все поля с запятыми заключены в двойные кавычки, которые обычно называются квалификаторами текста, т.е. одна ячейка с зеленым, синим и желтым цветом будет записана как «зеленый, синий и желтый».

Что такое файл CSV?

  1. Откройте файл с помощью приложения для работы с электронными таблицами
  2. Нажмите Файл, затем выберите Сохранить как
  3. Выберите место, где вы хотите сохранить свой файл. Ниже вы увидите Save как тип выберите CSV (с разделителями-запятыми) и, наконец, нажмите Save. кнопку.
  4. Приложение может отображать сообщение о том, что некоторые функции вашей книги могут быть потеряны, если вы сохраните ее в формате CSV. То есть любая форма formatтакой жирный текст не будет сохранен. Просто нажмите Да для продолжения.

При создании файла CSV стандартной практикой является разделение полей данных ограничитель, который всегда в форме запятой. Имейте в виду, это должен быть один символ, иначе ваши данные не будут иметь никакого логического смысла. Далее следует убедиться, что список заголовков разделен так же, как и весь файл. И почему это является неотъемлемой частью всего создания файла CSV? Это поможет вам получить точные результаты при вводе запроса.

Как открыть файл CSV

Преимущественно, программы для работы с электронными таблицами широко используются для открытия файлов CSV. Здесь гораздо проще их прочитать. Программа электронных таблиц систематически сортирует данные в CSV-файле по столбцам. Это помогает отфильтровать все содержимое файла. Не забывая, что пользователь может получить максимальную отдачу от бесплатных инструментов для работы с электронными таблицами, таких как Kingsoft Spreadsheets или очень распространенного OpenOffice Calc.

Если у вас есть OpenOffice Calc уже установлен на вашем компьютере, файл CSV должен открываться автоматически при двойном щелчке по нему. Как еще один вариант, ваш компьютер покажет Открыть с помощью подскажите, откуда вы можете выбрать программу для открытия файла CSV.

Кроме того, вы можете использовать онлайн-программы для работы с электронными таблицами, такие как Google Sheets или Zoho Office, которые имеют инновационные функции на борту. Эти инструменты позволяют нескольким пользователям получать доступ к одному файлу в режиме реального времени. Если быть точным, в Google Sheets более интересно то, что он позволяет конвертировать файлы Excel в листы и наоборот.

Вы можете использовать Google Drive, чтобы открыть файл CSV. Процесс довольно прост. Просто следуйте этим простым шагам;

  1. Откройте Google Drive и войдите в свою учетную запись Google.
  2. Найдите папку, в которой находится файл, который вы хотите добавить на Google Диск
  3. Перетащите файл из исходного местоположения в раздел «Мой диск».
  4. Ваш браузер выдаст подтверждение о том, что ваш файл был правильно добавлен на Google Диск
  5. Теперь вы можете дважды щелкнуть файл, чтобы открыть его после завершения загрузки.

A Текстовый редактор также используется для открытия файла CSV. Как правило, операционные системы Mac поставляются с программой TextEdit, в то время как Windows использует Notepad в качестве предустановленного приложения. К сожалению, такие программы не способны обрабатывать файлы с огромными объемами данных. Чтобы устранить это препятствие, существует распространенность известных сторонних приложений, которые пригодятся, когда пользователь хочет иметь дело со сложными файлами CSV.

Итак, почему текстовые редакторы обычно используются для обработки файла CSV?

С этого момента вы можете создать файл из square один, используя язык программирования, такой как CSS или HTML. Кроме того, пользователь может редактировать файлы, которые заканчиваются расширениями, такими как TXT, XML, CSV или PHP, и это лишь некоторые из них.

Преобразование файла CSV

Этот шаг очень важен, если вы собираетесь время от времени взаимодействовать с CSV-файлами. Любой файл CSV можно преобразовать в формат Microsoft Excel. format всего одним нажатием кнопки. Пользователю нужно просто нажать Файл, и перейти в Сохранить как кнопка. Здесь есть formatДоступны такие форматы, как XLS, TXT, XML, SQL и многие другие. Стоит отметить, что документы Google также помогают с преобразованием файлов.

Если на вашем компьютере нет программы для преобразования файлов, вы можете перейти прямо в браузере и использовать бесплатное программное обеспечение для преобразования файлов. Вы можете сделать это онлайн без необходимости утомительного процесса загрузки программы.

Помимо обычного CSV (с разделителями-запятыми), есть и другие formats, которые вступают в игру;

  1. CSV (Macintosh) — используется для сохранения таблицы Excel в виде файла, разделенного запятыми, для компьютеров, использующих операционную систему Mac.
  2. Unicode Text(*txt) — универсальный format который используется в большинстве операционных систем, включая Linux, Windows и Macintosh. Лучшая часть об этом format заключается в том, что он читает все последние языки.

Итак, как мне экспортировать мой файл Excel в CSV?

На практике данные экспортируются из файла Excel в CSV либо с кодировкой UTF-8, либо с кодировкой UTF-16. Итак, позвольте мне объяснить различия. В UTF-8 кодировка более сжата, поскольку для каждого символа используется от 1 до 4 байтов. Этот тип кодирования совместим со всеми символами. formats на основе ASCII (американский стандартный код для Informatобмен ионами).

UTF-16 сохраняет один символ в 2 в байтах 4. Он используется, когда ваши данные имеют азиатские символы, такие как японский и китайский.

Файл CSV замечательно используется во многих областях. Если мы добавим в это уравнение индустрию электронной коммерции, то на самом деле мы сможем найти очень многое. Вы можете импортировать и экспортировать файлы, чтобы обновлять свой инвентарь и продукт вformatион. Добавление новых или существующих продуктов вполне осуществимо. Владелец интернет-магазина может использовать эту стратегию для передачи данных о новых клиентах и ​​беспрепятственного управления запасами. Вы можете использовать файлы для импорта номеров отслеживания для всех продуктов, находящихся в пути к покупателям.

CSV Структурирование

Все структуры, используемые в файле CSV, легко создать и требуют меньше усилий, поскольку все они следуют одному и тому же принципу. format. Если вы wish чтобы сделать это вручную, вы можете использовать текстовый редактор, такой как Notepad++, который поддерживает несколько основных Программирование языки. Кроме того, использование программы для работы с электронными таблицами может лучше удовлетворять потребности пользователя, поскольку в ней есть ячейки, в которых данные сортируются по строкам и столбцам.

Как создать файл CSV

Итак, как бы вы создали файл CSV? Ну, для начала нужно убедиться, что у вас стоит нужная программа. CSV — это простой файл format предназначен для хранения табличных данных, таких как данные, которые вы получаете из базы данных или электронной таблицы. Вы можете импортировать и экспортировать файлы в формате CSV в различные среды.

Интересно, что хотя вы импортируете табличные данные с помощью CSV-файла, это текстовый файл. Другими словами, вы можете создать свой CSV-файл, используя любой редактор, способный изменять текст. Чаще всего файл CSV создается путем экспорта файла и нажатия кнопок «Файл» > «Экспорт». Если вы создали электронную таблицу в программе, вы можете просто экспортировать содержимое этого файла в CSV. format при использовании программы.

Самый простой способ создать файл CSV — начать с электронной таблицы в чем-то вроде Microsoft Excel. Когда вы закончите редактировать свой контент, вместо того, чтобы сохранять его как обычный текстовый файл, вы просто сохраняете файл как CSV, что означает, что вы можете разделять каждую новую строку запятой. Перед сохранением в CSV убедитесь, что в содержимое вашей электронной таблицы нет дополнительных запятых, так как это может привести к ошибкам в данных.

Возможно, вы обнаружите, что экспортировать и импортировать файлы CSV будет проще, если вы не будете использовать большое количество знаков препинания, таких как кавычки, точка с запятой и другое содержимое в своих табличных данных.

В программе Excel щелкните меню файла и выберите вариант для Сохранить как. Вы должны увидеть опцию «Сохранить как тип», где вы можете выбрать файл CSV. format как один из вариантов. Нажмите на параметр значений, разделенных символами, и введите имя файла, под которым вы хотите сохранить содержимое. Нажмите «Да», когда вам будет предложено подтвердить, что вы хотите использовать этот тип файла, и закончите, нажав «Сохранить».

Также можно загружать различные файлы из Интернета в формате CSV. format. Например, вы можете загрузить списки контактов электронной почты или данные счета в текстовом формате CSV. format чтобы было проще загрузить файл электронной таблицы в другой сервис.

CSV и Excel (.xls) — в чем разница?

Наиболее распространенный метод сохранения файлов CSV включает в себя выбор определенного типа файла в Microsoft Excel или аналогичной службе электронных таблиц. Однако, если вы щелкните правой кнопкой мыши имя стандартного файла Excel, вы заметите, что он обычно сохраняется в другом файле. format: .XLS.

Разница между CSV и XLS довольно проста. CSV format представляет собой обычный текстовый файл, в котором значения разделяются запятыми. Однако XLS — это решение совсем другого типа, известное как «бинарный файл». format». Это держится вformatобо всех рабочих листах в вашем файле, включая formatтинг и варианты содержания.

Файлы CSV можно открывать в любой программе для работы с электронными таблицами, включая Google Sheets, Open Office и Microsoft Excel. Вы можете открыть файл CSV в простом текстовом редакторе, и он совместим с большинством платформ электронных таблиц. Однако у простоты CSV есть некоторые недостатки. Например, вы можете хранить только один лист в файле без каких-либо формул или formatтин.

Файлы XLS чаще встречаются в файлах книг Excel, если у вас версия между 97-2003, более поздние версии, скорее всего, будут в формате XLSX. format вместо. Расширение XLS специально разработано для Microsoft Excel, но это не значит, что вы не можете использовать его и в других средах.

Вы можете открывать файлы XLS с помощью средства просмотра Excel, что упрощает печать вformation из вашего файла значений. Microsoft Excel также может читать шаблон файла CSV, но могут возникнуть проблемы с разделителем в зависимости от вашего компьютера.

Одним из быстрых решений, вместо того, чтобы искать сложные учебные руководства в Интернете, является изменение расширения имени файла с CSV на TXT, когда вам нужно получить доступ к данным в Excel. Когда вы открываете файл .txt в Excel, вы можете вручную указать кодировку, разделители, formatтинг столбцов и так далее.

Файлы Excel, как правило, являются лучшим выбором, если вы храните более сложные данные, а файлы CSV поддерживаются практически всеми интерфейсами загрузки данных. Если вы планируете перемещать данные между платформами, вам лучше использовать CSV. format.

Ревекка Картер

Ребекка Картер — опытный создатель контента, репортер новостей и блоггер, специализирующийся на маркетинге, развитии бизнеса и технологиях. Ее опыт охватывает все, от искусственного интеллекта до программного обеспечения для электронного маркетинга и устройств расширенной реальности. Когда она не пишет, Ребекка большую часть времени проводит за чтением, изучением природы и играми.

Редактируем CSV-файлы, чтобы не сломать данные

Продукты HFLabs в промышленных объемах обрабатывают данные: адреса, ФИО, реквизиты компаний и еще вагон всего. Естественно, тестировщики ежедневно с этими данными имеют дело: обновляют тест-кейсы, изучают результаты очистки. Часто заказчики дают «живую» базу, чтобы тестировщик настроил сервис под нее.

Первое, чему мы учим новых QA — сохранять данные в первозданном виде. Все по заветам: «Не навреди». В статье я расскажу, как аккуратно работать с CSV-файлами в Excel и Open Office. Советы помогут ничего не испортить, сохранить информацию после редактирования и в целом чувствовать себя увереннее.

Материал базовый, профессионалы совершенно точно заскучают.

Что такое CSV-файлы

Формат CSV используют, чтобы хранить таблицы в текстовых файлах. Данные очень часто упаковывают именно в таблицы, поэтому CSV-файлы очень популярны.

CSV-файл состоит из строк с данными и разделителей, которые обозначают границы столбцов

CSV расшифровывается как comma-separated values — «значения, разделенные запятыми». Но пусть название вас не обманет: разделителями столбцов в CSV-файле могут служить и точки с запятой, и знаки табуляции. Это все равно будет CSV-файл.

У CSV куча плюсов перед тем же форматом Excel: текстовые файлы просты как пуговица, открываются быстро, читаются на любом устройстве и в любой среде без дополнительных инструментов.

Из-за своих преимуществ CSV — сверхпопулярный формат обмена данными, хотя ему уже лет 40. CSV используют прикладные промышленные программы, в него выгружают данные из баз.

Одна беда — текстового редактора для работы с CSV мало. Еще ничего, если таблица простая: в первом поле ID одной длины, во втором дата одного формата, а в третьем какой-нибудь адрес. Но когда поля разной длины и их больше трех, начинаются мучения.

Следить за разделителями и столбцами — глаза сломаешь

Еще хуже с анализом данных — попробуй «Блокнотом» хотя бы сложить все числа в столбце. Я уж не говорю о красивых графиках.

Поэтому CSV-файлы анализируют и редактируют в Excel и аналогах: Open Office, LibreOffice и прочих.

Ветеранам, которые все же дочитали: ребята, мы знаем об анализе непосредственно в БД c помощью SQL, знаем о Tableau и Talend Open Studio. Это статья для начинающих, а на базовом уровне и небольшом объеме данных Excel с аналогами хватает.

Как Excel портит данные: из классики

Все бы ничего, но Excel, едва открыв CSV-файл, начинает свои лукавые выкрутасы. Он без спроса меняет данные так, что те приходят в негодность. Причем делает это совершенно незаметно. Из-за этого в свое время мы схватили ворох проблем.

Большинство казусов связано с тем, что программа без спроса преобразует строки с набором цифр в числа.

Округляет. Например, в исходной ячейке два телефона хранятся через запятую без пробелов: «5235834,5235835». Что сделает Excel? Лихо превратит номера́ в одно число и округлит до двух цифр после запятой: «5235834,52». Так мы потеряем второй телефон.

Приводит к экспоненциальной форме. Excel заботливо преобразует «123456789012345» в число «1,2E+15». Исходное значение потеряем напрочь.

Проблема актуальна для длинных, символов по пятнадцать, цифровых строк. Например, КЛАДР-кодов (это такой государственный идентификатор адресного объекта: го́рода, у́лицы, до́ма).

Удаляет лидирующие плюсы. Excel считает, что плюс в начале строки с цифрами — совершенно лишний символ. Мол, и так ясно, что число положительное, коль перед ним не стоит минус. Поэтому лидирующий плюс в номере «+74955235834» будет отброшен за ненадобностью — получится «74955235834». (В реальности номер пострадает еще сильнее, но для наглядности обойдусь плюсом).

Потеря плюса критична, например, если данные пойдут в стороннюю систему, а та при импорте жестко проверяет формат.

Разбивает по три цифры. Цифровую строку длиннее трех символов Excel, добрая душа, аккуратно разберет. Например, «8 495 5235834» превратит в «84 955 235 834».

Форматирование важно как минимум для телефонных номеров: пробелы отделяют коды страны и города от остального номера и друг от друга. Excel запросто нарушает правильное членение телефона.

Удаляет лидирующие нули. Строку «00523446» Excel превратит в «523446».
А в ИНН, например, первые две цифры — это код региона. Для Республики Алтай он начинается с нуля — «04». Без нуля смысл номера исказится, а проверку формата ИНН вообще не пройдет.

Меняет даты под локальные настройки. Excel с удовольствием исправит номер дома «1/2» на «01.фев». Потому что Windows подсказал, что в таком виде вам удобнее считывать даты.

Побеждаем порчу данных правильным импортом

Если серьезно, в бедах виноват не Excel целиком, а неочевидный способ импорта данных в программу.

По умолчанию Excel применяет к данным в загруженном CSV-файле тип «General» — общий. Из-за него программа распознает цифровые строки как числа. Такой порядок можно победить, используя встроенный инструмент импорта.

Запускаю встроенный в Excel механизм импорта. В меню это «Data → Get External Data → From Text».

Выбираю CSV-файл с данными, открывается диалог. В диалоге кликаю на тип файла Delimited (с разделителями). Кодировка — та, что в файле, обычно определяется автоматом. Если первая строка файла — шапка, отмечаю «My Data Has Headers».

Перехожу ко второму шагу диалога. Выбираю разделитель полей (обычно это точка с запятой — semicolon). Отключаю «Treat consecutive delimiters as one», а «Text qualifier» выставляю в «». (Text qualifier — это символ начала и конца текста. Если разделитель в CSV — запятая, то text qualifier нужен, чтобы отличать запятые внутри текста от запятых-разделителей.)

На третьем шаге выбираю формат полей, ради него все и затевалось. Для всех столбцов выставляю тип «Text». Кстати, если кликнуть на первую колонку, зажать шифт и кликнуть на последнюю, выделятся сразу все столбцы. Удобно.

Дальше Excel спросит, куда вставлять данные из CSV — можно просто нажать «OK», и данные появятся в открытом листе.

Перед импортом придется создать в Excel новый workbook

Но! Если я планирую добавлять данные в CSV через Excel, придется сделать еще кое-что.

После импорта нужно принудительно привести все-все ячейки на листе к формату «Text». Иначе новые поля приобретут все тот же тип «General».

  • Нажимаю два раза Ctrl+A, Excel выбирает все ячейки на листе;
  • кликаю правой кнопкой мыши;
  • выбираю в контекстном меню «Format Cells»;
  • в открывшемся диалоге выбираю слева тип данных «Text».

Чтобы выделить все ячейки, нужно нажать Ctrl+A два раза. Именно два, это не шутка, попробуйте

После этого, если повезет, Excel оставит исходные данные в покое. Но это не самая твердая гарантия, поэтому мы после сохранения обязательно проверяем файл через текстовый просмотрщик.

Альтернатива: Open Office Calc

Для работы с CSV-файлами я использую именно Calc. Он не то чтобы совсем не считает цифровые данные строками, но хотя бы не применяет к ним переформатирование в соответствии с региональными настройками Windows. Да и импорт попроще.

Конечно, понадобится пакет Open Office (OO). При установке он предложит переназначить на себя файлы MS Office. Не рекомендую: хоть OO достаточно функционален, он не до конца понимает хитрое микрософтовское форматирование документов.

А вот назначить OO программой по умолчанию для CSV-файлов — вполне разумно. Сделать это можно после установки пакета.

Итак, запускаем импорт данных из CSV. После двойного клика на файле Open Office показывает диалог.

Заметьте, в OO не нужно создавать новый воркбук и принудительно запускать импорт, все само

  1. Кодировка — как в файле.
  2. «Разделитель» — точка с запятой. Естественно, если в файле разделителем выступает именно она.
  3. «Разделитель текста» — пустой (все то же, что в Excel).
  4. В разделе «Поля» кликаю в левый-верхний квадрат таблицы, подсвечиваются все колонки. Указываю тип «Текст».

Помимо Calc у нас в HFLabs популярен libreOffice, особенно под «Линуксом». И то, и другое для CSV применяют активнее, чем Excel.

Бонус-трек: проблемы при сохранении из Calc в .xlsx

Если сохраняете данные из Calc в экселевский формат .xlsx, имейте в виду — OO порой необъяснимо и масштабно теряет данные.

Белая пустошь, раскинувшаяся посередине, в оригинальном CSV-файле богато заполнена данными

Поэтому после сохранения я еще раз открываю файл и убеждаюсь, что данные на месте.

Если что-то потерялись, лечение — пересохранить из CSV в .xlsx. Или, если установлен Windows, импортнуть из CSV в Excel и сохранить оттуда.

После пересохранения обязательно еще раз проверяю, что все данные на месте и нет лишних пустых строк.

Если интересно работать с данными, посмотрите на наши вакансии. HFLabs почти всегда нужны аналитики, тестировщики, инженеры по внедрению, разработчики. Данными обеспечим так, что мало не покажется 🙂

  • Блог компании HFLabs
  • Информационная безопасность
  • IT-стандарты
  • Хранение данных
  • Софт

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *