本文《CSV 到日期和浮动》主要内容涉及到等等知识点,希望能帮到你!当然如果阅读本文时存在不同想法,可以在评论中表达,但是请勿使用过激的措辞~
问题内容
我目前正在编写一个小程序,它将 csv 文件转换为用于进一步处理的结构。 csv 行看起来像这样
20140102,09:30,38.88,38.88,38.82,38.85,67004
我有 500 个文件,每个文件大约 20-30 mb。 我的代码工作得很好,但我不禁想知道是否没有比我现在正在做的更好的方法来转换这些文件。 首先读取文件并转换为csv记录(伪代码)
data, err := ioutil.readfile(path)
if err != nil {
...
}
r := csv.newreader(bytes.newreader(data))
records, err := r.readall()
if err != nil {
...
}
然后循环所有记录并执行
parsedTime, err := time.Parse("2006010215:04", record[0]+record[1])
if err != nil {
return model.ZorroT6{}, time.Time{}, err
}
t6.Date = ConvertToOle(parsedTime)
if open, err := strconv.ParseFloat(record[2], 32); err == nil {
t6.Open = float32(open)
}
if high, err := strconv.ParseFloat(record[3], 32); err == nil {
t6.High = float32(high)
}
if low, err := strconv.ParseFloat(record[4], 32); err == nil {
t6.Low = float32(low)
}
if close, err := strconv.ParseFloat(record[5], 32); err == nil {
t6.Close = float32(close)
}
if vol, err := strconv.ParseInt(record[6], 10,32); err == nil {
t6.Vol = int32(vol)
}
例如,我必须通过 []byte -> string -> float64 -> float32 才能获取浮点值。我可以做些什么来改进这段代码?
编辑:需要明确的是,我实际上并不需要提高性能,我只是更好地尝试了解 go 以及可以将哪些性能优化应用于此类问题。例如,当我有一个字节切片并想要一个 float32 时,创建大量字符串和 float64 的开销似乎很大。
解决方案
我发现只有一个问题需要修复:
请勿将 ioutil.ReadFile 与 bytes.NewReader 一起使用。它将所有内容读入内存,当文件较大时,效率较低。
相反,使用os.Open(file),它完美地提供了io.Reader,csv.NewReader可以利用。不要忘记关闭文件并处理错误。
如果您仍想提高性能:
由于您的 csv 文件是固定格式,因此可以使用 bufio 提供的原始字节来代替 csv。
您可以将底层代码复制并粘贴到 strconv 和 time 中,以避免出现不需要的通用代码。
但我认为他们不值得这么麻烦。
到这里,我们也就讲完了《CSV 到日期和浮动》的内容了。