zbkm
Участник
- Регистрация
- 9 Янв 2021
- Сообщения
- 99
- Реакции
- 170
Как хранить данные, в какой бд.
1) Текстовые строки, 40гб+ (миллиард строк).
Каждая строка уникальна, и поделена на подстроки (которые будут храниться в отдельных ячейках). Подстроки не уникальны. Нужно будет производить выборку по подстрокам и возвращать соответствующие им строки.
2) Картинки 32х32, несколько сотен миллионов + текстовые строки. Сами картинки не нужны (хранить их хэши? какие?). Только проверять их наличие в базе, и если есть возвращать связанные строки, следовательно строк у одной картинки может быть несколько. Картинки и строки уникальны (то есть на моменте парсинга планирую откинуть все дублирующиеся значения).
Конечно, думал, всё засунуть в mysql, но вдруг есть варианты лучше?
1) Текстовые строки, 40гб+ (миллиард строк).
Каждая строка уникальна, и поделена на подстроки (которые будут храниться в отдельных ячейках). Подстроки не уникальны. Нужно будет производить выборку по подстрокам и возвращать соответствующие им строки.
2) Картинки 32х32, несколько сотен миллионов + текстовые строки. Сами картинки не нужны (хранить их хэши? какие?). Только проверять их наличие в базе, и если есть возвращать связанные строки, следовательно строк у одной картинки может быть несколько. Картинки и строки уникальны (то есть на моменте парсинга планирую откинуть все дублирующиеся значения).
Конечно, думал, всё засунуть в mysql, но вдруг есть варианты лучше?