- 22, Oct 2024
- #1
Мне нужно выявить закономерности в текстовом файле для дальнейшего анализа. Таким образом, входные файлы могут содержать полуструктурированный текст следующим образом:
файл1
| [email protected] | er34532 | | [email protected] | 764474 |
файл2
- | : \space+ \tab+
количество слов в строке может различаться для каждого документа. разделитель также различается, но уникален для каждого документа. я хочу подсчитать количество слов в каждой строке в каждом документе.
вывод будет:
для файла1
4
4
4
4
для файла2
5
5
5
5
Я хочу обобщить это для любого файла с любым разделителем. Это может быть nathen <tab> [email protected] <tab> 764323545 <tab> UK
thomas <tab> [email protected] <tab> 563363421 <tab> UK
ian <tab> [email protected] <tab> 3453245472 <tab> SP
.
Некоторые файлы следующие:
905:john: abc123: [email protected]: US
920:eric: ericaA: [email protected]: US
1000: rio: ri0ri0: [email protected]: IN
#bash #шаблоны