Я не могу найти file.ReadLine
функцию в Go. Я могу понять, как быстро написать письмо, но просто интересно, не хочу ли я что-то здесь забыть. Как читать файл по строкам?
Чтение файла по строкам в go
Ответ 1
В пакете bufio
есть функция ReadLine.
Обратите внимание, что если строка не помещается в буфер чтения, функция вернет незавершенную строку. Если вы хотите всегда читать целую строку в своей программе с помощью одного вызова функции, вам необходимо инкапсулировать функцию ReadLine
в свою собственную функцию, которая вызывает ReadLine
в цикле for.
bufio.ReadString('\n')
не полностью эквивалентен ReadLine
, потому что ReadString
не может обрабатывать случай, когда последняя строка файла не заканчивается символом новой строки.
Ответ 2
В Go 1.1 и новее самый простой способ сделать это - bufio.Scanner
. Вот простой пример, который читает строки из файла:
package main
import (
"bufio"
"fmt"
"log"
"os"
)
func main() {
file, err := os.Open("/path/to/file.txt")
if err != nil {
log.Fatal(err)
}
defer file.Close()
scanner := bufio.NewScanner(file)
for scanner.Scan() {
fmt.Println(scanner.Text())
}
if err := scanner.Err(); err != nil {
log.Fatal(err)
}
}
Это самый чистый способ чтения из Reader
по строкам.
Существует одна оговорка: сканер не справляется с строками длиной более 65536 символов. Если это проблема для вас, тогда вы должны, вероятно, перевернуть свой собственный поверх Reader.Read()
.
Ответ 3
Использование:
-
reader.ReadString('\n')
- Если вы не возражаете, что линия может быть очень длинной (т.е. использовать много оперативной памяти). Он сохраняет
\n
в конце возвращаемой строки.
- Если вы не возражаете, что линия может быть очень длинной (т.е. использовать много оперативной памяти). Он сохраняет
-
reader.ReadLine()
- Если вы беспокоитесь об ограничении потребления ОЗУ и не возражаете против дополнительной работы по обработке случая, когда строка больше размера буфера читателя.
Я тестировал различные решения, предлагаемые путем написания программы для проверки сценариев, которые идентифицируются как проблемы в других ответах:
- Файл с линией 4 МБ.
- Файл, который не заканчивается разрывом строки.
Я обнаружил, что:
- Решение
Scanner
не обрабатывает длинные строки. - Решение
ReadLine
сложно реализовать. - Решение
ReadString
является самым простым и работает для длинных строк.
Вот код, который демонстрирует каждое решение, его можно запустить через go run main.go
:
package main
import (
"bufio"
"bytes"
"fmt"
"io"
"os"
)
func readFileWithReadString(fn string) (err error) {
fmt.Println("readFileWithReadString")
file, err := os.Open(fn)
defer file.Close()
if err != nil {
return err
}
// Start reading from the file with a reader.
reader := bufio.NewReader(file)
var line string
for {
line, err = reader.ReadString('\n')
fmt.Printf(" > Read %d characters\n", len(line))
// Process the line here.
fmt.Println(" > > " + limitLength(line, 50))
if err != nil {
break
}
}
if err != io.EOF {
fmt.Printf(" > Failed!: %v\n", err)
}
return
}
func readFileWithScanner(fn string) (err error) {
fmt.Println("readFileWithScanner - this will fail!")
// Don't use this, it doesn't work with long lines...
file, err := os.Open(fn)
defer file.Close()
if err != nil {
return err
}
// Start reading from the file using a scanner.
scanner := bufio.NewScanner(file)
for scanner.Scan() {
line := scanner.Text()
fmt.Printf(" > Read %d characters\n", len(line))
// Process the line here.
fmt.Println(" > > " + limitLength(line, 50))
}
if scanner.Err() != nil {
fmt.Printf(" > Failed!: %v\n", scanner.Err())
}
return
}
func readFileWithReadLine(fn string) (err error) {
fmt.Println("readFileWithReadLine")
file, err := os.Open(fn)
defer file.Close()
if err != nil {
return err
}
// Start reading from the file with a reader.
reader := bufio.NewReader(file)
for {
var buffer bytes.Buffer
var l []byte
var isPrefix bool
for {
l, isPrefix, err = reader.ReadLine()
buffer.Write(l)
// If we've reached the end of the line, stop reading.
if !isPrefix {
break
}
// If we're just at the EOF, break
if err != nil {
break
}
}
if err == io.EOF {
break
}
line := buffer.String()
fmt.Printf(" > Read %d characters\n", len(line))
// Process the line here.
fmt.Println(" > > " + limitLength(line, 50))
}
if err != io.EOF {
fmt.Printf(" > Failed!: %v\n", err)
}
return
}
func main() {
testLongLines()
testLinesThatDoNotFinishWithALinebreak()
}
func testLongLines() {
fmt.Println("Long lines")
fmt.Println()
createFileWithLongLine("longline.txt")
readFileWithReadString("longline.txt")
fmt.Println()
readFileWithScanner("longline.txt")
fmt.Println()
readFileWithReadLine("longline.txt")
fmt.Println()
}
func testLinesThatDoNotFinishWithALinebreak() {
fmt.Println("No linebreak")
fmt.Println()
createFileThatDoesNotEndWithALineBreak("nolinebreak.txt")
readFileWithReadString("nolinebreak.txt")
fmt.Println()
readFileWithScanner("nolinebreak.txt")
fmt.Println()
readFileWithReadLine("nolinebreak.txt")
fmt.Println()
}
func createFileThatDoesNotEndWithALineBreak(fn string) (err error) {
file, err := os.Create(fn)
defer file.Close()
if err != nil {
return err
}
w := bufio.NewWriter(file)
w.WriteString("Does not end with linebreak.")
w.Flush()
return
}
func createFileWithLongLine(fn string) (err error) {
file, err := os.Create(fn)
defer file.Close()
if err != nil {
return err
}
w := bufio.NewWriter(file)
fs := 1024 * 1024 * 4 // 4MB
// Create a 4MB long line consisting of the letter a.
for i := 0; i < fs; i++ {
w.WriteRune('a')
}
// Terminate the line with a break.
w.WriteRune('\n')
// Put in a second line, which doesn't have a linebreak.
w.WriteString("Second line.")
w.Flush()
return
}
func limitLength(s string, length int) string {
if len(s) < length {
return s
}
return s[:length]
}
Я тестировал:
- go версия go1.7 windows/amd64
- go версия go1.6.3 linux/amd64
- go версия go1.7.4 darwin/amd64
Вывод тестовой программы:
Long lines
readFileWithReadString
> Read 4194305 characters
> > aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
> Read 12 characters
> > Second line.
readFileWithScanner - this will fail!
> Failed!: bufio.Scanner: token too long
readFileWithReadLine
> Read 4194304 characters
> > aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
> Read 12 characters
> > Second line.
No linebreak
readFileWithReadString
> Read 28 characters
> > Does not end with linebreak.
readFileWithScanner - this will fail!
> Read 28 characters
> > Does not end with linebreak.
readFileWithReadLine
> Read 28 characters
> > Does not end with linebreak.
Ответ 4
EDIT: Начиная с go1.1, идиоматическим решением является использование bufio.Scanner
Я написал способ легко прочитать каждую строку из файла. Функция Readln (* bufio.Reader) возвращает строку (sans\n) из базовой структуры bufio.Reader.
// Readln returns a single line (without the ending \n)
// from the input buffered reader.
// An error is returned iff there is an error with the
// buffered reader.
func Readln(r *bufio.Reader) (string, error) {
var (isPrefix bool = true
err error = nil
line, ln []byte
)
for isPrefix && err == nil {
line, isPrefix, err = r.ReadLine()
ln = append(ln, line...)
}
return string(ln),err
}
Вы можете использовать Readln для чтения каждой строки из файла. Следующий код считывает каждую строку в файле и выводит каждую строку в стандартный вывод.
f, err := os.Open(fi)
if err != nil {
fmt.Printf("error opening file: %v\n",err)
os.Exit(1)
}
r := bufio.NewReader(f)
s, e := Readln(r)
for e == nil {
fmt.Println(s)
s,e = Readln(r)
}
Ура!
Ответ 5
Существует два распространенных способа чтения файла построчно.
- Используйте bufio.Scanner
- Используйте ReadString/ReadBytes/... в bufio.Reader
В моем тестовом примере ~ 250 МБ, ~ 2 500 000 строк, bufio.Scanner (использованное время: 0,395491384s) быстрее, чем bufio.Reader.ReadString(time_used: 0,446867622s).
Исходный код: https://github.com/xpzouying/go-practice/tree/master/read_file_line_by_line
Считайте файл использования bufio.Scanner,
func scanFile() {
f, err := os.OpenFile(logfile, os.O_RDONLY, os.ModePerm)
if err != nil {
log.Fatalf("open file error: %v", err)
return
}
defer f.Close()
sc := bufio.NewScanner(f)
for sc.Scan() {
_ = sc.Text() // GET the line string
}
if err := sc.Err(); err != nil {
log.Fatalf("scan file error: %v", err)
return
}
}
Чтение файла с использованием bufio.Reader,
func readFileLines() {
f, err := os.OpenFile(logfile, os.O_RDONLY, os.ModePerm)
if err != nil {
log.Fatalf("open file error: %v", err)
return
}
defer f.Close()
rd := bufio.NewReader(f)
for {
line, err := rd.ReadString('\n')
if err != nil {
if err == io.EOF {
break
}
log.Fatalf("read file line error: %v", err)
return
}
_ = line // GET the line string
}
}
Ответ 6
Вы также можете использовать ReadString с \n в качестве разделителя:
f, err := os.Open(filename)
if err != nil {
fmt.Println("error opening file ", err)
os.Exit(1)
}
defer f.Close()
r := bufio.NewReader(f)
for {
path, err := r.ReadString(10) // 0x0A separator = newline
if err == io.EOF {
// do something here
break
} else if err != nil {
return err // if you return error
}
}
Ответ 7
Пример из этой сущности
func readLine(path string) {
inFile, err := os.Open(path)
if err != nil {
fmt.Println(err.Error() + ': ' + path)
return
}
defer inFile.Close()
scanner := bufio.NewScanner(inFile)
for scanner.Scan() {
fmt.Println(scanner.Text()) // the line
}
}
но это дает ошибку, когда есть строка, которая больше, чем буфер сканера.
Когда это произошло, я использую reader := bufio.NewReader(inFile)
создания и конкатенации моего собственного буфера с использованием ch, err := reader.ReadByte()
или len, err := reader.Read(myBuffer)
Ответ 8
bufio.Reader.ReadLine() работает хорошо. Но если вы хотите прочитать каждую строку с помощью строки, попробуйте использовать ReadString ('\n'). Это не нужно изобретать колесо.
Ответ 9
// strip '\n' or read until EOF, return error if read error
func readline(reader io.Reader) (line []byte, err error) {
line = make([]byte, 0, 100)
for {
b := make([]byte, 1)
n, er := reader.Read(b)
if n > 0 {
c := b[0]
if c == '\n' { // end of line
break
}
line = append(line, c)
}
if er != nil {
err = er
return
}
}
return
}
Ответ 10
В приведенном ниже коде я прочитал интересы из CLI, пока пользователь не наткнулся на ввод, и я использую Readline:
interests := make([]string, 1)
r := bufio.NewReader(os.Stdin)
for true {
fmt.Print("Give me an interest:")
t, _, _ := r.ReadLine()
interests = append(interests, string(t))
if len(t) == 0 {
break;
}
}
fmt.Println(interests)
Ответ 11
import (
"bufio"
"os"
)
var (
reader = bufio.NewReader(os.Stdin)
)
func ReadFromStdin() string{
result, _ := reader.ReadString('\n')
witl := result[:len(result)-1]
return witl
}
Вот пример с функцией ReadFromStdin()
такой как fmt.Scan(&name)
но он принимает все строки с пробелами, например: "Hello My Name Is..."
var name string = ReadFromStdin()
println(name)
Ответ 12
Мне нравится решение Lzap, я новичок в Go, Я хотел бы попросить lzap, но я не мог этого сделать, у меня нет еще 50 очков. Я немного изменил ваше решение и выполнил код...
package main
import (
"bufio"
"fmt"
"io"
"os"
)
func main() {
f, err := os.Open("archiveName")
if err != nil {
fmt.Println(err)
os.Exit(1)
}
defer f.Close()
r := bufio.NewReader(f)
line, err := r.ReadString(10) // line defined once
for err != io.EOF {
fmt.Print(line) // or any stuff
line, err = r.ReadString(10) // line was defined before
}
}
Я не уверен, почему мне нужно снова проверить "err", но в любом случае мы можем это сделать. Но главный вопрос:.. почему Go не приводит к ошибке с предложением = > line, err: = r.ReadString(10), внутри цикла? Он определяется снова и снова каждый раз, когда цикл выполняется. Я избегаю этой ситуации с моими изменениями, комментариями? Я установил условие EOF в "for" как похожее на "В тоже время". Благодаря