Wpis z mikrobloga

Skopiuj link

13.09.2018, 16:53:44

7

hejka programistyczne świry
z listy o długości około 790 chciałm wybrać 5 jak najbardziej przypadkowych elementów
wydawało mi się że random.sample(l, k=5) jest dobrym rozwiązaniem tzn każdy pięcioelementowy podzbiór będzie mieć mniej więcej taką samą szansę na bycie wylosowanym
no ale chyba nie za bardzo tak jest bo przy pewnym ustalonym seedzie (2137*69 konkretniej) wyniki dla początkowych fragmentów listy o różnej długości nie różnią się za bardzo od siebie i zmieniają się istotnie dopiero w okolicach potęg dwójki
https://repl.it/repls/AssuredGeneralAtoms
czyli to tak jakby mniej więcej praktycznie nie brało pod uwagę elementów o indeksach powyżej 2\*\*floor(log(1000, 2)) ;///
no i ogólnie chyba nie spełnia w ogóle moich założeń o wybraniu 5 jak najbardziej przypadkowych elementów z danego zbioru ;\\

z drugiej strony przy zabawie w ten sposób:
https://repl.it/repls/UnevenMenacingPolyhedron
wszystko wydaje się w miarę ok, tzn elementy chyba są wybierane z w miaaaaaarę równym prawdopodobieństwem

jak poprawnie zrobić to co chciałm zrobić czyli po prostu ustalić sobie jakiś stały seed tak żeby wyniki były powtarzalne i dla danej listy wybrać jej jak najbardziej przypadkowy podzbiór, ale żeby jednocześnie dodanie albo usunięcie czegoś z końca listy jednak generowało zupełnie inny wynik a nie praktycznie na niego nie wpływało ;//
pierwszym co mi przychodzi do głowy jest dodanie do seeda len(lista) i chyba powinno to w miarę działać tak mi się wydaje
ale dlaczego właściwie sample działa inaczej niż sobie wyobrażałm
o co tu chodzi
czego nie rozumiem

#programowanie #python

13.09.2018, 16:59:08

0

@Chodtok: może tak

23 * 37 * (lista.lenght * 7)

Masz liczby pierwsze co gwarantuje lepszy hasz + dlugosc listy wplywa na hash

13.09.2018, 17:03:04

0

z listy o długości około 790 chciałm wybrać 5 jak najbardziej przypadkowych elementów

@Chodtok: problem losowości polega na tym, że 1 2 3 4 5 jest tak samo losowe jak 42 458 3 743 349 ;P

13.09.2018, 17:03:42

0

@Chodtok: zdefiniuj "najbardziej losowe"

13.09.2018, 17:03:48

0

@Chodtok: lista 790 elementów, tysiąc losowań, 5 elementów wybranych za każdym razem. Mnie tam to wygląda całkiem losowo. ¯\_(ツ)_/¯

źródło: comment_UyhlqPJw0YbF0beoVwifF9EqxDjAZF13.jpg

13.09.2018, 17:06:59

0

kurczę no chodzi mi o to że chciałm jak najbardziej uczciwie wybrać pięć osób spośród plusujących wpis
i w zasadzie to jakieś zewnętrzne liczby chyba nie są tu potrzebne i wystarczyłoby za seed brać długość listy
ale może się mylę i może ogólnie jest jakieś lepsze rozwiąznie

@morsik: @sokytsinolop: @Przegrywek123: @croppz:

13.09.2018, 17:08:36

0

no dobra ale odpalałeś to
https://repl.it/repls/AssuredGeneralAtoms

bo wyniki wyglądają dla mnie niezbyt losowo
tzn myślałm że na wynik w sample ma wpływ zawartość list
i jakiś tam pewnie ma ale duuuuużo mniejszy niż mi się wydawało

@croppz:

13.09.2018, 17:08:39

1

@Chodtok: a po co w ogóle seed?

morsik

13.09.2018, 17:09:29

1

@Chodtok: no cholera, jak zawsze dajesz tego samego seeda to czego oczekujesz?

morsik

13.09.2018, 17:10:16

0

hmmm no żeby zapewnić jakąś powtarzalność
tzn żebym mógł napisać za seed wziąłem to i to i morzecie sb zweryfikować wynik

@croppz:

13.09.2018, 17:10:34

0

@Chodtok: tak jak @croppz mówi. Seed niepotrzebny. Jako seed powinieneś używać aktualnego czasu (wtedy zawsze będzie inny seed).

13.09.2018, 17:10:57

2

powtarzalność

@Chodtok: to chcesz losowe czy powtarzalne? ;) Zdecyduj się.

konto usunięte
venomik

konto usunięte 13.09.2018, 17:11:39

1

@morsik: losowe ale dajace sie zweryfikowac zapewne :)

Chodtok

konto usunięte 13.09.2018, 17:12:10

0

@Chodtok: posortuj losowo tablice z jakims seedem biez pierwsze 5 osob

13.09.2018, 17:12:12

0

no cholera, jak zawsze dajesz tego samego seeda to czego oczekujesz?

no oczekiwałem tego że sample pomimo tego samego seeda dla różnych list generuje różne wyniki tzn że w algorytmie losowania zmienność listy jest jakoś bardziej istotna

@croppz:

13.09.2018, 17:13:31

0

to chcesz losowe czy powtarzalne? ;) Zdecyduj się.

ehhh no tak jak kolega wyżej napisał chodzi mi o losowe ale dające się zweryfikować

@morsik:

konto usunięte 13.09.2018, 17:14:48

0

posortuj losowo tablice z jakims seedem biez pierwsze 5 osob

@LowcaG: bierz oczywiscie ( ͡° ͜ʖ ͡°)

13.09.2018, 17:20:11

0

w sensie chciałbym tak jak np tak jak tutaj móc napisać przeprowadziłem losowanie w taki i w taki sposób możecie to sobie zweryfikować
no tylko potem odkryłem że to chyba słaby sposób bo przy wybraniu konkretnego seeda lista miała dużo mniejszy wpływ na wynik niż myślałem że ma i duża jej część chyba wgl nie była brana pod uwagę

patrząc na to teraz najlepszym rozwiązaniem wydaje się mi po prostu wzięcie jako

13.09.2018, 17:21:51

0

posortuj losowo tablice z jakims seedem biez pierwsze 5 osob

hmmm nie jestem pewien ale w dokumentacji było coś chyba o tym że shuffle ma swoje ograniczenia

@LowcaG:

13.09.2018, 17:24:22

0

losowe ale dające się zweryfikować

@Chodtok: to bierz unix time jako seeda, nic lepszego tu nie wymyślisz. Chociaż też to większego sensu nie ma, bo możesz sobie po prostu wyszukać timestampa który da wynik jaki chcesz. W przykładzie z obrazka trwało to mniej niż 5 sekund.

źródło: comment_2McNS9Th7eWJZp6N1tneIdCUL3mVyjQG.jpg

13.09.2018, 17:25:37

0

@croppz: no nie może być unix time, bo @Chodtok chce dostać weryfikowalne wyniki - takie że jak sam odpalisz skrypt to dostaniesz te same osoby a nie zupełnie inne

konto usunięte 13.09.2018, 17:25:45

0

@Chodtok: a jakie? Bo w pythonie nie wiem.

Bo wiesz chodzi o to ze nie manipulujesz jak domniemam. Ale...

Skoro lista wejsciowa jest "dana" czyli na to nie wplywasz to moze ograniczenia shufle sa nieistotne a nie masz na nie wplywu i nie mozesz nimi manipulowac. Wiec ogolnie wszystko ok

13.09.2018, 17:26:16

1

@asciiterror: no, więc oprócz wyniku podajesz timestampa, którego każdy może użyć jako seeda.

konto usunięte

13.09.2018, 17:26:50

0

@Chodtok: a nie możesz jako seed dawać sumy aktalna sekunda + mikrosekunda?
Moim zdaniem lepsze to niż wrzucanie długości tablicy + stała wartość.

13.09.2018, 17:27:38

0

no dobra ale ustalony timestamp chyba nie różni się niczym od ustalonego przeze mnie 2137*69 i wtedy końcówka listy wydaje się nie mieć wpływu na wynik

@croppz:

13.09.2018, 17:27:42

0

@asciiterror: tyle że bez zabezpieczenia przed powtórnym losowaniem to i tak jest gówno warte

konto usunięte 13.09.2018, 17:27:47

0

@asciiterror: jest dokladnie tak jak pisze @croppz:

No i widac wtedy ze seed tez nie jest zmanipulowany(chociaz tak na prawde latwo zmanipulowc ;) )

13.09.2018, 17:28:21

0

@Chodtok: a czemu końcówka listy ma mieć wpływ? Ustalasz seeda, o wyniku decyduje seed.

13.09.2018, 17:30:18

1

a jakie? Bo w pythonie nie wiem.

Note that even for small len(x), the total number of permutations of x can quickly grow larger than the period of most random number generators. This implies that most permutations of a long sequence can never be generated. For example, a sequence of length 2080 is the largest that can fit within the period of the Mersenne Twister random number generator.

jeśli dobrze rozumiem może

konto usunięte

konto usunięte 13.09.2018, 17:30:25

0

@croppz: @Chodtok: algorytm uzyskania seeda musi byc poznany przed glosowaniem. Bo tal latwo o manipulacje czyli np. Podajesz jakas losowa liczbe publicznie plus liczba glosujacych

13.09.2018, 17:32:12

0

hmm a co właściwie w tym przypadku zmienia ta losowa liczba podana przed głosowaniem

@LowcaG:

konto usunięte 13.09.2018, 17:32:36

0

@Chodtok: takie cos nie jest chyba statystycznie istotne dopoki komus sie nie bedzie chcialo sprawdzic czy np. Ktoras lokata ma wieksze szanse

13.09.2018, 17:33:39

0

tzn w sumie co zmienia to czy losową liczbą jest 0 czy nie 0

@LowcaG:

konto usunięte 13.09.2018, 17:33:55

1

@Chodtok: wiele. Chcesz przyoszczedzic i robisz tak aby zawsze kolega wygrywal no to generujesz tyle seedow az w ktoryms wylosuje kolege i podajesz ten seed

venomik

konto usunięte 13.09.2018, 17:35:58

0

@Chodtok: a wracajac do shuffle to losujesz tylko jeden raz z jednego zestawu ludzi czyli rozklad cie az tak nie boli

13.09.2018, 17:37:05

0

hmmm no tak ale jest już ta liczba głosujących i tym ciężko manipulować
tzn jest to pewnie jakoś tam możliwe ale nie wiem co w tym kontekście zmienia znana_wszystkim_losowa_liczba + liczba_głosujących w porównaniu do 0 + liczba_głosujących

@LowcaG:

13.09.2018, 17:39:32

0

i chyba obliczanie seeda poprzez hashowanie całej listy głosujących tj ich nicków i wgl wydaje się jeszcze dużo trudniejsze do zmanipulowania niż sama liczba głosujących

@LowcaG:

13.09.2018, 17:39:48

0

@Chodtok: jeżeli używasz seeda to random nie jest randomowy i o wszystkim decyduje seed. Na tym polegają seedy, dają powtarzalne rezultaty. Dlatego jeżeli chcesz żeby twoje losowanie było wiarygodne musisz użyć seeda na którego wartość nie miałeś wpływu - dowolna liczba we wpisie (podana zanim ludzie zaczną plusować) + ilość plusów jest spoko, bo nie możesz dowolnie manipulować liczbą plusów.

Timestamp też jest spoko, jeżeli losowanie możesz zrobić tylko raz i

13.09.2018, 17:41:51

0

w sensie chodzi mi o to że zamiast

Bo tal latwo o manipulacje czyli np. Podajesz jakas losowa liczbe publicznie plus liczba glosujacych

a konkretniej

liczba glosujacych

lepsze byłoby chyba

hash(lista_głosujących)

13.09.2018, 17:42:12

0

jw

@croppz:

13.09.2018, 17:48:29

0

no ok oboje twierdzicie chyba to samo czyli że

znana wszystkim losowo liczba + liczba głosujących

jest spoko

no więc jeśli się nie mylę to

znana wszystkim losowa liczba + hasz listy głosujących

powinien być jeszcze bardziej spoko i odporny

ciekawi mnie jeszcze jak to się ma do realnego życia i ew profesjonalnych rozwiązań tego typu problemu

i wciąż nie łapię co tutaj zmienia ta znana wszystkim losowa liczba i czemu nie

13.09.2018, 17:55:40

0

@Chodtok: znając z góry seeda można łatwo sprawdzić które miejsca na liście dają największe szanse na wygraną - sam to widziałeś w swoim przykładzie.

Jeżeli o kolejności na liście decyduje kolejność plusowania to prędzej czy później jakiś cwaniak się zorientuje że wycofując plusa i plusując ponownie w odpowiednim momencie może sobie zapewnić zwycięstwo. ¯\_(ツ)_/¯

13.09.2018, 17:56:39 via Android

0

@Chodtok czekaj... biorąc konkretnego seeda, masz niejako konkretny sposób losowania. Czyli de facto konkretny wynik.
Tak, jakbyś zawsze brał czwarty element listy (honestly acquired by throwing a dice #pdk). Będzie to losowanie powtarzalne, weryfikowalne i zależne od listy, z której losujesz. Tyle tylko, że zawsze ten sam element...
W LOSOWANIU raczej chodzi o to, że jest LOSOWE i niepowtarzalne, a powtórzone wielokrotnie zwróci wszystkie elementy z jednakowym prawdopodobieństwem.

13.09.2018, 18:04:48

0

znając z góry seeda można łatwo sprawdzić które miejsca na liście dają największe szanse na wygraną

hmm no tak samego seeda nikt nie zna z góry bo zależy on od np liczby plusujących która jest nieznana
a to czy dodamy do tego znane wszystkim przed plusowaniem zero czy znane wszystkim przed plusowaniem niezero chyba niewiele zmienia (?)

i o manipulacje tu chyba ciężko bo nikt nie wie czy inny mniej kombinujący użytkownik

13.09.2018, 18:08:02

0

i ja też raczej nie bardzo mogę przy tym kombinować bo ustalając zamknięcie losowania na konkretną godzinę nie mam pojęcia kto zdecyduje się kiedy oddać głos, być może w ostatniej chwili, i jak to wpłynie na wynik

zwłaszcza jeśli biorę hash i wynik zależy od poszczególnych literek w każdym przypadkowym nicku

@croppz:

13.09.2018, 18:10:20

0

@Chodtok: no tak jak mówiłem, dowolna liczba - zero też się w sumie sprawdzi. ¯\_(ツ)_/¯

i o manipulacje tu chyba ciężko bo nikt nie wie czy inny mniej kombinujący użytkownik nie doda w ostatniej chwili swojego głosu co zmienia seed i teoretycznie całkowicie wynik

no dokładnie tak jak mówisz. Wbicie się na odpowiednią pozycję na liście miałoby sens tylko przy seedzie ustalonym z góry - wtedy jedyną zmienną w równaniu jest

konto usunięte 13.09.2018, 18:11:50

0

@Chodtok: (poprawka)zarowno zero jak i dowolna znana liczba jest bez sensu bo uzytkownicy manipuluja, dlatego lepsza by juz byla rzecz niezalezna jak np. Godzina ostatniwgo wpisu zamiast tego zera/liczby

konto usunięte 13.09.2018, 18:13:30

1

@croppz: > hash też się sprawdzi, czemu nie.

Uzytkownik wchodzac na liste przelicza hashe n do przodu i sprawdza czy mu sie oplaca

mk321

13.09.2018, 18:14:03

0

ale jakiego ostatniego wpisu
ta godzina to chyba dowolna znana liczba jak każda inna
i chyba to np hashowanie plusujących powinno zapewnić wystarczającą losowość (?)

@LowcaG:

13.09.2018, 18:16:07

0

@LowcaG: i jak to by miało wyglądać? Liczy hasze aż nie trafi na nick który po dodaniu do listy da seeda gwarantującego mu wynik po czym zakłada multi z takim nickiem i plusuje? Zanim trafi to ktoś inny zaplusuje i całe liczenie trzeba zaczynać od nowa, bez sensu.

13.09.2018, 18:16:19

1

Uzytkownik wchodzac na liste przelicza hashe n do przodu i sprawdza czy mu sie oplaca

hmm no ale on chyba nie wie czy zaraz nie zaplusuje tego "xardaswielkiczarodziej" czy "mihaubiauek" co kompletnie zmienia hash i jest chyba nieprzewidywalne
to już kombinowanie przy braniu liczby głosów wydaje się dużo łatwiejsze

@LowcaG:

mk321

Aktywne Wpisy

2 godz. i 28 min. temu

publikowanie takich filmow to jest idiotyzm (no ale czego sie spodziewac po wiadomo kim) - przeciez to tylko woda na mlyn dla ruskich, dodatkowo przeciez jesli beda wiedziec ze po zlapaniu beda zabijani to nie beda chcieli sie poddawac skoro poddanie sie=smierc to beda woleli walczyc do ostatniego naboju. (ps nawet jesli to wagner to i tak stosuje sie wobec nich prawo miedzynarodowe) #rosja #wojna #ukraina

źródło: XD

5 godz. i 6 min. temu

#turcja To dwumiesięczne niemowlę zostało uratowane po tym, jak leżało pod gruzami po trzęsieniu ziemi przez 128 godzin
This two-month-old baby was rescued after laying under quake rubble for 128 hours. A miracle

źródło: FosNwNCXgAI39_a