Wpis z mikrobloga

Skopiuj link

13.09.2018, 15:53:44

hejka programistyczne świry
z listy o długości około 790 chciałm wybrać 5 jak najbardziej przypadkowych elementów
wydawało mi się że random.sample(l, k=5) jest dobrym rozwiązaniem tzn każdy pięcioelementowy podzbiór będzie mieć mniej więcej taką samą szansę na bycie wylosowanym
no ale chyba nie za bardzo tak jest bo przy pewnym ustalonym seedzie (2137*69 konkretniej) wyniki dla początkowych fragmentów listy o różnej długości nie różnią się za bardzo od siebie i zmieniają się istotnie dopiero w okolicach potęg dwójki
https://repl.it/repls/AssuredGeneralAtoms
czyli to tak jakby mniej więcej praktycznie nie brało pod uwagę elementów o indeksach powyżej 2\*\*floor(log(1000, 2)) ;///
no i ogólnie chyba nie spełnia w ogóle moich założeń o wybraniu 5 jak najbardziej przypadkowych elementów z danego zbioru ;\\

z drugiej strony przy zabawie w ten sposób:
https://repl.it/repls/UnevenMenacingPolyhedron
wszystko wydaje się w miarę ok, tzn elementy chyba są wybierane z w miaaaaaarę równym prawdopodobieństwem

jak poprawnie zrobić to co chciałm zrobić czyli po prostu ustalić sobie jakiś stały seed tak żeby wyniki były powtarzalne i dla danej listy wybrać jej jak najbardziej przypadkowy podzbiór, ale żeby jednocześnie dodanie albo usunięcie czegoś z końca listy jednak generowało zupełnie inny wynik a nie praktycznie na niego nie wpływało ;//
pierwszym co mi przychodzi do głowy jest dodanie do seeda len(lista) i chyba powinno to w miarę działać tak mi się wydaje
ale dlaczego właściwie sample działa inaczej niż sobie wyobrażałm
o co tu chodzi
czego nie rozumiem

#programowanie #python

Przegrywek123

13.09.2018, 15:59:08

@Chodtok: może tak

23 * 37 * (lista.lenght * 7)

Masz liczby pierwsze co gwarantuje lepszy hasz + dlugosc listy wplywa na hash

morsik

13.09.2018, 16:03:04

z listy o długości około 790 chciałm wybrać 5 jak najbardziej przypadkowych elementów

@Chodtok: problem losowości polega na tym, że 1 2 3 4 5 jest tak samo losowe jak 42 458 3 743 349 ;P

sokytsinolop

13.09.2018, 16:03:42

@Chodtok: zdefiniuj "najbardziej losowe"

croppz

13.09.2018, 16:03:48

@Chodtok: lista 790 elementów, tysiąc losowań, 5 elementów wybranych za każdym razem. Mnie tam to wygląda całkiem losowo. ¯\_(ツ)_/¯

Chodtok

13.09.2018, 16:06:59

kurczę no chodzi mi o to że chciałm jak najbardziej uczciwie wybrać pięć osób spośród plusujących wpis
i w zasadzie to jakieś zewnętrzne liczby chyba nie są tu potrzebne i wystarczyłoby za seed brać długość listy
ale może się mylę i może ogólnie jest jakieś lepsze rozwiąznie

@morsik: @sokytsinolop: @Przegrywek123: @croppz:

Chodtok

13.09.2018, 16:08:36

no dobra ale odpalałeś to
https://repl.it/repls/AssuredGeneralAtoms

bo wyniki wyglądają dla mnie niezbyt losowo
tzn myślałm że na wynik w sample ma wpływ zawartość list
i jakiś tam pewnie ma ale duuuuużo mniejszy niż mi się wydawało

croppz

13.09.2018, 16:08:39

@Chodtok: a po co w ogóle seed?

croppz

13.09.2018, 16:09:29

@Chodtok: no cholera, jak zawsze dajesz tego samego seeda to czego oczekujesz?

Chodtok

13.09.2018, 16:10:16

hmmm no żeby zapewnić jakąś powtarzalność
tzn żebym mógł napisać za seed wziąłem to i to i morzecie sb zweryfikować wynik

@croppz:

morsik

13.09.2018, 16:10:34

@Chodtok: tak jak @croppz mówi. Seed niepotrzebny. Jako seed powinieneś używać aktualnego czasu (wtedy zawsze będzie inny seed).

morsik

13.09.2018, 16:10:57

powtarzalność

@Chodtok: to chcesz losowe czy powtarzalne? ;) Zdecyduj się.

L.....G

konto usunięte 13.09.2018, 16:11:39

@morsik: losowe ale dajace sie zweryfikowac zapewne :)

L.....G

konto usunięte 13.09.2018, 16:12:10

@Chodtok: posortuj losowo tablice z jakims seedem biez pierwsze 5 osob

Chodtok

13.09.2018, 16:12:12

no cholera, jak zawsze dajesz tego samego seeda to czego oczekujesz?

no oczekiwałem tego że sample pomimo tego samego seeda dla różnych list generuje różne wyniki tzn że w algorytmie losowania zmienność listy jest jakoś bardziej istotna

@croppz:

Chodtok

13.09.2018, 16:13:31

to chcesz losowe czy powtarzalne? ;) Zdecyduj się.

ehhh no tak jak kolega wyżej napisał chodzi mi o losowe ale dające się zweryfikować

@morsik:

L.....G

konto usunięte 13.09.2018, 16:14:48

posortuj losowo tablice z jakims seedem biez pierwsze 5 osob

@LowcaG: bierz oczywiscie ( ͡° ͜ʖ ͡°)

Chodtok

13.09.2018, 16:20:11

w sensie chciałbym tak jak np tak jak tutaj móc napisać przeprowadziłem losowanie w taki i w taki sposób możecie to sobie zweryfikować
no tylko potem odkryłem że to chyba słaby sposób bo przy wybraniu konkretnego seeda lista miała dużo mniejszy wpływ na wynik niż myślałem że ma i duża jej część chyba wgl nie była brana pod uwagę

patrząc na to teraz najlepszym rozwiązaniem wydaje się mi po prostu wzięcie jako seed długości

Chodtok

13.09.2018, 16:21:51

posortuj losowo tablice z jakims seedem biez pierwsze 5 osob

hmmm nie jestem pewien ale w dokumentacji było coś chyba o tym że shuffle ma swoje ograniczenia

@LowcaG:

croppz

13.09.2018, 16:24:22

losowe ale dające się zweryfikować

@Chodtok: to bierz unix time jako seeda, nic lepszego tu nie wymyślisz. Chociaż też to większego sensu nie ma, bo możesz sobie po prostu wyszukać timestampa który da wynik jaki chcesz. W przykładzie z obrazka trwało to mniej niż 5 sekund.

croppz - > losowe ale dające się zweryfikować

@Chodtok: to bierz unix time jako se... — **źródło:** comment_2McNS9Th7eWJZp6N1tneIdCUL3mVyjQG.jpg
Pobierz

asciiterror

13.09.2018, 16:25:37

@croppz: no nie może być unix time, bo @Chodtok chce dostać weryfikowalne wyniki - takie że jak sam odpalisz skrypt to dostaniesz te same osoby a nie zupełnie inne