PetScan/Otázky a odpovědi

Instrukce: V tomto modulu se učíme rozumět dataminingovému nástroji PetScan formou otázek a odpovědí. Pokud Vás napadne nějaká otázka, můžete ji zkusit vyhledat níže a pokud bude mít i odpověď máte vyhráno. Pokud odpovědi mít nebude, najdete odpověď na internetu a doplníte ji sem. Ale pozor, vlastními slovy. Z internetu se nesmí kopírovat. Pokud níže není ani Vaše otázka, tak ji doplníte včetně Vaši následní odpovědi.

Č. Otázka Odpověď Poznámky
1 Co je to PetScan?
2 Lze vyplněný PetScan získat v nějakém přehledném formátu typu csv? Pouze formou url. Je ale otázka, jestli to k něčemu bude, když nevíme co je která položka v GUI. Získám-li url, mohu použít bash skript (echo "url" | tr '&' '\n' | grep -v '=$') pro separaci vyplněných položek do řádků.
interface_language=en
cb_labels_any_l=1
output_compatability=catscan
ns%5B6%5D=1
project=wikimedia
ores_prediction=any
wikidata_item=no
cb_labels_no_l=1
min_redlink_count=1
cb_labels_yes_l=1
wpiu=any
combination=subset
edits%5Banons%5D=both
depth=20
active_tab=tab_output
sortby=none
links_to_all=user%3AJuandev
page_image=any
language=commons
categories=Belgrade
search_max_results=500
edits%5Bbots%5D=both
add_image=on
3 Lze vytáhnout soubor s časovými značkami, kdy byl soubor vytvořen? PetScan:Output:Files:Extended data for files Musí být zaškrnuto
4 Co představuje položka "touched" ve výpisu PetScanu?
5 Jak vypsat všechny soubory, které nahrál na Commons určitý uživatel?
  • Categorie:Language:commons
    • Project:wikimedia
  • Page properties:Namespaces:File
  • Templates&links:Links to:All of these pages:User:XY
A pokud je těch souborů hodně, tak je nejlepší to vypsat do souboru CSV, tedy v záložce Output:Format:CSV. Kdyby chtěl uživatel zadat více uživatelů, musí v sekci Templates and links volit možnost Any of these pages.
6 Pracuje PetScan na API, nebo na backupu?
7 Jaký hashovací algoritmus pro sha1 používá a jak ty klíče vytváří?

Odstraňování problémů

editovat
Č. Problém Řešení Poznámky
1 No result for source categories V tomto přípípadě šlo o nějaký malware, který mi tam sám od sebe vyplnoval položky.