Hacker News with Generative AI: Sequence Modeling

Were RNNs all we needed? (arxiv.org)
The scalability limitations of Transformers regarding sequence length have renewed interest in recurrent sequence models that are parallelizable during training.

Deep Learning, Sequence Modeling, Scalability

520 points by beefman 516 days ago | 260 comments