Если вам нужен главный список всех изображений и размеров, что-то вроде страниц «статистики», в Docker Hub его нет. Вам понадобится использовать их HTTP API, чтобы:
- получить все репозитории, просматривая результаты с разбивкой на страницы. Ссылка на API: https://docs.docker.com/registry/spec/api/#listing-repositories
- извлеките манифест изображения для каждого репозитория. Ссылка на API: https://docs.docker.com/registry/spec/api/#pulling-an-image-manifest
- Сохраните эти манифесты в локальной базе данных, чтобы можно было сортировать их по размеру изображения.
В частности, вам нужно будет получить новейшую Image Manifest Version 2, Schema 2
, which apparently not all repos support yet. This newer manifest has the image sizes in it: https://docs.docker.com/registry/spec/manifest-v2-2/
В целом, это намного быстрее, чем пытаться загрузить все изображения из Docker Hub, но все равно займет довольно много времени и много обработки. База данных для хранения всего этого может оказаться довольно большой и сложной для обработки, поэтому я не уверен, насколько вам действительно хочется идти по этому пути для простого исследовательского проекта. Это зависит от вас.
Возможно, вы захотите последовать совету @Vish и просто использовать очевидные большие изображения, такие как изображения Microsoft или Java.