Group: CVS and Subversion

Forums > Forum "Fragen und Antworten (Q&A)" > Article thread "Volltextsuche in Repositories"

Article thread - Articles 1-7 out of 7

  • Volltextsuche in Repositories 23 Oct 2009, 9:26 pm

    Hallo,

    mich würde mal interessieren wie ihr es mit dem Suchen in Repositories haltet.

    Ich selber halte eine schnelle Volltextsuche a la Google mittlerweile für unverzichtbar. Und es vergeht auch keine Woche, in der mir googeln im Repository nicht viel Zeit erspart hätte.
    Deswegen habe ich von einiger Zeit meinen eigene Volltextsuche für Subversion Repositories programmiert
    http://svnquery.tigris.org
    Die hat sich in der Praxis schon mehrfach bezahlt gemacht.

    Ausser mir und ein paar Einzelpersonen scheint das Interesse an diesem Thema jedoch sehr gering zu sein. Ich wundere mich woran das wohl liegen könnte:
    - der Entwickler würde zwar gerne suchen, hat aber entweder keine Zeit oder keine Erlaubnis für das Repository den Volltextindex anzulegen?
    - der Administrator muss nicht suchen und hat somit keinen Leidensdruck?
    - der Entwickler nutzt lieber ein "Find in Files" auf der lokalen Platte?

    Verspürt ihr den Wunsch auch mal das ganze Repository zu durchsuchen? Wie ist das in anderen Versionskontrollsystemen gelöst? Mercurial und Git scheinen in Punkte Suche ja auch schwach zu sein.

    Noch ein aktuelles Beispiel, wie nützlich das Durchsuchen des gesamten Repositories sein kann:

    In einem (neuen) Installer für ein Addon für ein sehr altes Produkt wollte ich ein spezielles neues Recht anlegen. Dazu fragte ich einen altgedienten Kollegen nach der entsprechenden Rechte-Anlege-Funktion. "Ja, die gäbe es, aber nur in C und mit selbstgemachter Verschlüsselung und es wäre ganz aufwendig." Also wollte ich ein Beispiel sehen. Ihm fiel aber nur ein, dass man sich unter dem speziellen User "IRWU" anmelden muss. Also haben wir einfach nach "IRWU" gesucht und eine Sekunde später den entsprechenden Code gefunden. Aber nicht nur den, sondern auch einen Wrapper in C#, der bereits vor zwei Jahren programmiert wurde! Den konnte ich sofort verwenden und habe damit jede Menge Zeit gespart.

    Andere Beispiele:
    - finden von kritischen Stellen für Vista Kompatibilität (Schreiben nach HKLM, OCX registrieren)
    - suchen nach bad coding patterns (leere catch Clauses)

    Danke für jede Art von Feedback

    Christian
  • Re: Volltextsuche in Repositories 30 Oct 2009, 7:33 pm

    Hallo,

    mal eine Frage zu der Suche....werden auch Word, Excel, PDF, OpenOffice Dokumente indiziert und sind die dann auch durchsuchbar ?

    Also sprich kann ich nach dem Inhalt eines Word- oder PDF Files suchen ?
    MfG
    Karl Heinz
  • Re^2: Volltextsuche in Repositories 30 Oct 2009, 9:44 pm

    Ich verwende Repositories hauptsächlich zur Versionierung von Quelltexten, also plain-text Formate. Word Dokumente liegen in einem Content Management System (Sharepoint), da ist Volltextsuche ein natürliches Feature (im Gegensatz zu Versions Kontroll Systemen). Technisch wäre es zwar möglich per Plugin beliebige Dokumenttypen (also auch Office oder Pdf's) zu indizieren, aber dafür bestand bisher kein Bedarf.

    Die Antwort ist also leider nein, nur das das Suchen im Quellcode ist möglich.

    Grüße

    Christian
  • Re^3: Volltextsuche in Repositories 01 Nov 2009, 7:51 pm

    Hallo,

    zuerst einmal vielen Dank für die Antwort....was mir noch aufgefallen ist, das Ganze ist in .NET gemacht also nichts für Linux und Mac's ....schade...

    Ich selbst bin schon seit ca. 2 Jahren an einer Java Lösung dran...die auch sehr gute Ergebnisse liefert...und eben sowohl Office, PDF, zip, jar's, tar.gz etc. Dokumente indiziert...

    http://www.supose.org

    Was ich noch vergessen habe: 2008 habe ich schon einen Vortrag über das Thema gemacht: http://2008.subconf.de/powertrack-subversion/karl-heinz-marb...

    Dazu die Folien: http://www.soebes.de/files/SubConf2008SupoSE.pdf
    und in der Links Liste der Subversion Seite ist das Projekt auch aufgeführt: http://subversion.tigris.org/links.html

    Achso und die am weitesten fortgeschrittene Lösung: http://www.voilasvn.com/main/page_download.html (aber leider kein OpenSource).

    MfG
    Karl Heinz Marbaise
    This article was modified on 01 Nov 2009 at 08:01 pm.
  • Re^3: Volltextsuche in Repositories 02 Nov 2009, 7:24 pm

    Stimmt,

    über Supose bin ich gestolpert als ich mit der ersten SvnQuery Version fertig war. Als ich Anfang 2008 für meine Firma nach einer Lösung hatte ich noch nichts gefunden (außer VoilaSvn, dass aber für die nackte Suche damals nicht in Frage kam). Zu .NET: man entwickelt halt in dem was man am besten kann, und in der Windows Welt, in der ich lebe, ist .NET bzw. ASP.NET keine schlechte Wahl. Ein Windows/IIS Administrator richtet die Website in fünf Minuten, gibt man ihm einen Apache, brauche er ersteinmal zwei Tage um sich vom Kulturschock des Config-Files zu erholen ;-) Aber theoretisch läuft SvnQuery mit Hilfe von Mono auch unter Linux, es werden keinerlei exotischen Features verwendet.

    Aber meine Frage bleibt: Hast du Anwender von Supose/VoilaSvn die es wirklich regelmäßig nutzen? Oder ist "Suchen" ein Feature das man haben muss, aber dann niemand anwendet? In meiner Firma war der Start zumindestens zäh, bis die Verwendung der SvnWebQuery Suche gegenüber Find-In-File gewonnen hatte. Vielleicht Macht der Gewohnheit, weil kein Versionskontrollsystem von Haus aus eine vernünftige Suche mitbringt?

    Danke für die Links

    Christian
  • Article only visible to registered members
  • Re^2: Volltextsuche in Repositories 06 Nov 2009, 3:25 pm

    Hallo Ralf,

    der Index wird zuerst im Speicher erstellt, erst bei einem Commit wird er auf die Platte zurückgeschrieben. D.h. beim ersten Erstellen ist es normal dass sich im Zielverzeichnis nicht viel befindet. Wenn mich mein Gedächnis nicht täuscht flusht Lucene in 50MB Schritten. 400KB kommt mir auch recht wenig vor, der Index des Subversion Repositories ist z.B. ca100MB groß. Falls du die Websitze zum Laufen bekommst, siehst du auch wie viele Dokumente indiziert wurden.

    Grüße

    Christian

Forums > Forum "Fragen und Antworten (Q&A)" > Article thread "Volltextsuche in Repositories"

Top