parser

package
v0.3.0 Latest Latest
Warning

This package is not in the latest version of its module.

Go to latest
Published: Oct 27, 2024 License: GPL-3.0 Imports: 14 Imported by: 0

Documentation

Index

Constants

This section is empty.

Variables

This section is empty.

Functions

func ParseDirectory

func ParseDirectory(path string, recursive bool) ([][]byte, error)

ParseDirectory parcourt un répertoire et parse tous les fichiers supportés

func ParsePDF

func ParsePDF(path string) ([]byte, error)

ParsePDF reads a PDF file and returns its content as a byte slice.

func RegisterParser

func RegisterParser(format string, parser FormatParser)

RegisterParser enregistre un nouveau parser pour un format donné

Types

type DOCXParser

type DOCXParser struct {
	// contains filtered or unexported fields
}

DOCXParser implémente l'interface Parser pour les fichiers DOCX

func (*DOCXParser) GetMetadata

func (p *DOCXParser) GetMetadata() map[string]string

GetMetadata retourne les métadonnées du fichier DOCX

func (*DOCXParser) Parse

func (p *DOCXParser) Parse(path string) ([]byte, error)

Parse extrait le contenu textuel d'un fichier DOCX

type FormatParser

type FormatParser func() Parser

FormatParser est une fonction qui crée un Parser spécifique à un format

type HTMLParser

type HTMLParser struct {
	// contains filtered or unexported fields
}

HTMLParser implémente l'interface Parser pour les fichiers HTML

func (*HTMLParser) GetMetadata

func (p *HTMLParser) GetMetadata() map[string]string

GetMetadata retourne les métadonnées du fichier HTML

func (*HTMLParser) Parse

func (p *HTMLParser) Parse(path string) ([]byte, error)

Parse extrait le contenu textuel d'un fichier HTML

type MarkdownParser

type MarkdownParser struct {
	// contains filtered or unexported fields
}

MarkdownParser implémente l'interface Parser pour les fichiers Markdown

func (*MarkdownParser) GetMetadata

func (p *MarkdownParser) GetMetadata() map[string]string

GetMetadata retourne les métadonnées du fichier Markdown

func (*MarkdownParser) Parse

func (p *MarkdownParser) Parse(path string) ([]byte, error)

Parse lit le contenu d'un fichier Markdown

type PDFParser

type PDFParser struct {
	// contains filtered or unexported fields
}

func (*PDFParser) GetMetadata

func (p *PDFParser) GetMetadata() map[string]string

func (*PDFParser) Parse

func (p *PDFParser) Parse(path string) ([]byte, error)

type Parser

type Parser interface {
	// Parse prend le chemin d'un fichier et retourne son contenu en bytes
	Parse(path string) ([]byte, error)
	// GetMetadata retourne les métadonnées du document sous forme de map
	GetMetadata() map[string]string
}

Parser définit l'interface pour tous les analyseurs de documents

func GetParser

func GetParser(format string) (Parser, error)

GetParser retourne le parser approprié basé sur le format spécifié

func NewDOCXParser

func NewDOCXParser() Parser

NewDOCXParser crée une nouvelle instance de DOCXParser

func NewHTMLParser

func NewHTMLParser() Parser

NewHTMLParser crée une nouvelle instance de HTMLParser

func NewMarkdownParser

func NewMarkdownParser() Parser

NewMarkdownParser crée une nouvelle instance de MarkdownParser

func NewPDFParser

func NewPDFParser() Parser

func NewTextParser

func NewTextParser() Parser

NewTextParser crée une nouvelle instance de TextParser

type TextParser

type TextParser struct {
	// contains filtered or unexported fields
}

TextParser implémente l'interface Parser pour les fichiers texte

func (*TextParser) GetMetadata

func (p *TextParser) GetMetadata() map[string]string

GetMetadata retourne les métadonnées du fichier texte

func (*TextParser) Parse

func (p *TextParser) Parse(path string) ([]byte, error)

Parse lit le contenu d'un fichier texte

Jump to

Keyboard shortcuts

? : This menu
/ : Search site
f or F : Jump to
y or Y : Canonical URL