Tento rok som uprednostnil The One Billion Rows Challenge pre Advent of code. V článku popisujem niektoré nástroje a optimalizácie, ktoré som použil.
The One Billion Rows Challenge je primitívna úloha, máme súbor v UTF-8, v ktorom je názov miesta a nameraná teplota (ako desatinné číslo). Úlohou je spraviť program, ktorý tento súbor prejde a na konci, pre každé miesto vypísať minimálnu, priemernú a maximálnu teplotu.
To nie je nič ťažké, hádam v každom vyššom jazyku ide táto úloha vyriešiť za 5 minút a ešte si dať kávu. Tak v čom je tá výzva? V počte riadkov, je ich 10^9 a testovací súbor v mojom prípade mal cez 13GB.
Viac na: