Wpis z mikrobloga

via Wykop Mobilny (Android)
  • 0
Cześć Mirko, mam pytanie i szukam jakiegoś ciekawego rozwiązania:
czy znacie może jakiś trick, który umożliwiłby odpytywanie w jednej kwerendzie SQLowej Pandasowych dataframewów oraz tabel na Teradacie tzn.
używam pd.readsqlquery i wynik zapisuję do df'a result1, a na Teradacie mam tabelę result2. I teraz - czy istnieje możliwość zrobienia czegoś takiego:
SELECT * FROM result1 INNER JOIN result2 ON result1.ID =result2.ID;
W sensie w jednym zapytaniu użyć tabeli z Teradaty i dataframe'u lokalnego? Bo odpytywać dataframe'y sqlem można np. przy użyciu pandasql biblioteki, ale właśnie chodzi o łączenie tych dwóch.
Tak myślę nad tym od paru dni i albo coś mi umyka albo nie znalazłem prostej odpowiedzi. Spotkał się ktoś kiedyś z was z czymś takim? Dzięki za ewentualną odpowiedź.
#python #teradata #programowanie
  • 3
@Awerege: Nie wiem czym jest teradata ( ͡° ͜ʖ ͡°)

Ale wątpliwe, tzn. strzelam że dataframe musiałbyś wsadzić do tabeli sqlowej żeby móc w ten sposób joinować. Pytanie co to za klejenie i do czego tzn. jak ważny jest performance.

Ja podobne problemy rozwiązywałem raczej tworząc drugiego df sczytując dane z db (WHERE IN + tupla z listą id wyciągana z df) a potem merge w pandasach.
@Awerege: Wątpię, żeby takie połączenie było możliwe. Ja bym spróbował zapisać unikatowe id z result1 do tymczasowej tabeli na teradacie, wyciągnąć "where existem" odpowiadające im dane z result2 do dataframe'a i złączenie zrobić już w pandas.