Gephi като инструмент за визуализация на данни
Случи се така, че в крайна сметка станах асистент на професор в университета. Никога не съм мислил, че ще трябва да се занимавам с оценка на риска и визуализация на данни, като по призвание съм криптограф. Курсът се нарича „Информационни мрежи“ и включва: анализ на случайни процеси, моделиране на малки светове; компютърни алгоритми за оценка на мрежовите свойства; експериментални изследвания на големи мрежи, както и анализ на риска, които е трудно да се предвидят.
С оглед на факта, че курсът се преподава главно за ИТ специалисти, лекторът заложи на даването на достатъчно теория с минимум математика и много практика. За повечето от горните задачи е подходящ NetLogo. Той включва свой собствен език за програмиране на високо ниво, който ви позволява лесно да симулирате различни произволни процеси. Програмата Gephi е избрана за визуализация на различни данни.
Всъщност проблемът беше формулиран по следния начин: визуализация на всички реални данни с помощта на Gephi.
Генериране на данни
Файлови формати на Gephi
Gephi разбира доста голям брой файлови формати.
Както можете да видите от снимката, най-добрият вариант е да използвате gexf. Както се оказа, това е отворен формат и библиотеката може лесно да бъде изтеглена от тук. Сайтът посочва, че Libgexf в момента работи само под Linux (тестван в Ubuntu 8.10 и 9.04). Без колебание реших да изтегля източниците и да компилирам за Ubuntu 11.10 с интерфейси за Python (тъй като реших да внедря останалата част от него върху него). Генерирах тестов файл и реших да го стартирам в Gephi, но той не отвори нито моя файл, нито тези, изтеглени от интернет, нито дори този, който си запазих. Не знам каква е грешката, но след като рових малко и го изпробвах на две машини, реших да се откажа от това начинание и да потърся алтернатива. След като се заиграх с CSV и разбрах, че неговата функционалност не е достатъчна, попаднах на импортиране от базата данни.
Той може да бъде намерен в File -> Import Database -> Edge list. ". Първоначално си помислих, че „Edge list“ е просто импортиране на ръбове, но се оказва, че върховете също се импортират. Можете да използвате SQLite, MySQL, PostgreSQL и Teradata като база данни. В прозореца за импортиране отгоре има намек за параметрите на таблицата. Трябва да има две таблици: възли и ръбове. Таблицата с възли трябва да съдържа колони:
- задължително:
- id - номер на върха
- не е задължително:
- етикет - етикет или обозначение на върха
- x - координатата x на равнината, където ще се намира върхът на графиката
- y - координатата y на равнината, където ще се намира върхът на графиката
- размер - размерът на върха