Wpis z mikrobloga

@niegramwwowa: któregokolwiek takiego narzędzia bym nie dotknął to nie wypluwa nic innego jak to na czym się nauczyło: setek if-ów bo tego jest najwięcej -> czytaj uczy się na hinduskim kodzie bo go jest dużo i potem mamy super AI code completion -> jak te hindusi co szybko naleśniki robią albo super baseny z PRIMITIVE housing które też się rozpadają po kilku dniach poza kamerą ;)
@criskrzysiu

Our training dataset was collected in May 2020 from 54 million public software repositories hosted on GitHub, containing 179 GB of unique Python files under 1 MB. We filtered out files which were likely auto-generated, had average line length greater than 100, had maximum line length greater than 1000, or contained a small percentage of alphanumeric characters. After filtering, our final dataset totaled 159 GB.


To tylko na potrzeby referatu. Ogolnie