首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在不知道编译时结构的情况下读取CSV数据?

如何在不知道编译时结构的情况下读取CSV数据?
EN

Stack Overflow用户
提问于 2020-10-15 18:46:57
回答 1查看 391关注 0票数 3

我是Rust的新手,正在尝试实现某种数据库。用户应该通过给出一个表名、一个列名矢量和一个列类型矢量(通过枚举实现)来创建表。填表应该通过指定csv文件来完成。但是,这需要在编译时指定表行的结构,如基本示例所示:

代码语言:javascript
运行
复制
#[derive(Debug, Deserialize, Eq, PartialEq)]
struct Row {
    key: u32,
    name: String,
    comment: String
}
use std::error::Error;
use csv::ReaderBuilder;
use serde::Deserialize;
use std::fs;

fn read_from_file(path: &str) -> Result<(), Box<dyn Error>> {
    let data = fs::read_to_string(path).expect("Unable to read file");
    let mut rdr = ReaderBuilder::new()
        .has_headers(false)
        .delimiter(b'|')
        .from_reader(data.as_bytes());
    let mut iter = rdr.deserialize();

    if let Some(result) = iter.next() {
        let record:Row = result?;
        println!("{:?}", record);
        Ok(())
    } else {
        Err(From::from("expected at least one record but got none"))
    }   
}

是否有可能使用泛型表信息而不是“行”-struct来转换反序列化的结果?是否可以简单地根据列类型的组合大小分配内存并解析中的记录?我会在C中做这样的事情。

EN

回答 1

Stack Overflow用户

发布于 2020-10-16 00:58:37

是否有可能使用泛型表信息而不是“行”-struct来转换反序列化的结果?

在编译时,所有泛型都替换为具体类型。如果你不知道你在运行时需要的类型,“泛型”不是你需要的。

是否可以简单地根据列类型的组合大小分配内存并解析中的记录?我会在C中做这样的事情。

我建议使用Box<dyn Any>,这样就能够存储任何类型的引用,并且仍然知道它是什么类型。

这种方法的维护成本相当高。你必须在你想要使用单元格的值的地方管理每种可能的值类型。另一方面,您不需要每次都解析值,只需在运行时进行一些类型检查。

我已经使用std::any::TypeId来标识类型,但不能在match表达式中使用它。您可以考虑使用自定义枚举作为类型标识符。

代码语言:javascript
运行
复制
use std::any::{Any, TypeId};
use std::io::Read;

use csv::Reader;

#[derive(Default)]
struct Table {
    name: String,
    headers: Vec<(String, TypeId)>,
    data: Vec<Vec<Box<dyn Any>>>,
}

impl Table {
    fn add_header(&mut self, header: String, _type: TypeId) {
        self.headers.push((header, _type));
    }

    fn populate_data<R: Read>(
        &mut self,
        rdr: &mut Reader<R>,
    ) -> Result<(), Box<dyn std::error::Error>> {
        for record in rdr.records() {
            let record = record?;
            let mut row: Vec<Box<dyn Any>> = vec![];
            for (&(_, type_id), value) in self.headers.iter().zip(record.iter()) {
                if type_id == TypeId::of::<u32>() {
                    row.push(Box::new(value.parse::<u32>()?));
                } else if type_id == TypeId::of::<String>() {
                    row.push(Box::new(value.to_owned()));
                }
            }
            self.data.push(row);
        }
        Ok(())
    }
}

impl std::fmt::Display for Table {
    fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
        writeln!(f, "Table: {}", self.name)?;
        for (name, _) in self.headers.iter() {
            write!(f, "{}, ", name)?;
        }
        writeln!(f)?;
        for row in self.data.iter() {
            for cell in row.iter() {
                if let Some(&value) = cell.downcast_ref::<u32>() {
                    write!(f, "{}, ", value)?;
                } else if let Some(value) = cell.downcast_ref::<String>() {
                    write!(f, "{}, ", value)?;
                }
            }
            writeln!(f)?;
        }
        Ok(())
    }
}

fn main() {
    let mut table: Table = Default::default();
    table.name = "Foo".to_owned();
    table.add_header("key".to_owned(), TypeId::of::<u32>());
    table.add_header("name".to_owned(), TypeId::of::<String>());
    table.add_header("comment".to_owned(), TypeId::of::<String>());
    let data = "\
key,name,comment
1,foo,foo comment
2,bar,bar comment
";
    let mut rdr = Reader::from_reader(data.as_bytes());
    table.populate_data(&mut rdr).unwrap();
    print!("{}", table);
}
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64369887

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档